WithAnyone-復旦共同ステップスター・オープンソースAI写真生成モデル
What'sウィズ・エニワン?
WithAnyoneは復旦大学とStepStarが共同開発したAI写真生成モデルで、従来のAI画像生成によくある「コピー&ペースト」問題を解決し、より自然で制御可能な多人数画像生成を実現します。WithAnyoneは拡散モデルアーキテクチャに基づいており、生成画像のアーティファクトを効果的に低減し、同一性の類似性と生成の多様性を向上させます。このモデルはオープンソース化されており、モデル、データセット、デモはHugging Faceで公開されています。 ユーザーは簡単に個人写真をアップロードして、様々なシナリオで任意の人物との集合写真を生成し、自然でリアルなAI画像生成効果を体験することができます。

WithAnyoneの主な特徴
- マルチフォト・ジェネレーション複数の人物を1枚の集合写真の中に自然に溶け込ませ、控えめなイメージを作り出す能力。
- アイデンティティの一貫性維持文字の同一性を保ったまま画像を生成できるため、入力文字との類似性が高い。
- 細部の柔軟な調整キャラクターの表情や姿勢、髪型など、細部まで柔軟に調整することが可能です。
- コピー&ペースト」によるアーティファクトの低減AI画像生成プロセスは高度な技術に基づいており、従来のAI画像生成によく見られる「コピー&ペースト」現象を効果的に低減し、画質を向上させている。
- オープンソースと使いやすさこのモデルはオープンソースであり、ユーザーはHugging Faceのリソースを見つけることで、簡単にこの技術を使い、体験することができる。
ウィズエニワンの技術理念
- 大規模データセットのサポートMultiID-2Mデータセットは、50万枚の複数人集合写真と、様々な表情、髪型、角度をカバーする多数の参照画像を含み、モデル学習に豊富なデータを提供します。
- 対照的なアイデンティティ喪失トレーニング対比的同一性喪失(CIL)とペアワイズデータトレーニングにより、同一性忠実性と生成多様性のバランスをとり、生成された画像がキャラクターの同一性を維持しつつ、自然な視覚効果を持つようにする。
- 拡散モデル・アーキテクチャ拡散モデルベースのアーキテクチャは、高い同一性類似性を維持し、生成された画像の全体的な品質を向上させながら、「コピー&ペースト」のアーティファクトを効果的に低減する。
- IDコードキャラクタのアイデンティティ特性をエンコードすることで、生成プロセスにおいてキャラクタ固有の属性が正確に復元され、アイデンティティの混乱を避けることができます。
- マルチタスクの最適化モデルの総合的なパフォーマンスと適応性を向上させるために、トレーニング中にアイデンティティ維持、姿勢調整、背景融合などの複数のタスクを同時に最適化する。
WithAnyoneのプロジェクトアドレス
- プロジェクトのウェブサイト:: https://doby-xu.github.io/WithAnyone/
- Githubリポジトリ:: https://github.com/Doby-Xu/WithAnyone
- HuggingFaceモデルライブラリ:: https://huggingface.co/WithAnyone/WithAnyone
- arXivテクニカルペーパー:: https://arxiv.org/pdf/2510.14975
- オンライン体験デモ:: https://huggingface.co/spaces/WithAnyone/WithAnyone_demo
WithAnyoneの対象者
- ソーシャルメディア・ユーザーAI技術を利用して、アイドルや友人、家族とのクリエイティブな集合写真を生成し、ソーシャル・プラットフォームで共有することが期待されている。
- コンテンツクリエータービデオ、記事、広告を作成するために、複数人の高品質な集合写真を素早く生成する必要があります。
- デザイナー&フォトグラファー創造的なデザインやバーチャル撮影のために、新しい映像表現を探求する。
- 愛用者AI技術の楽しさを体験し、エンターテイメントや思い出に残るパーソナライズされた写真を作りましょう。
- テクノロジー愛好家&開発者AI画像生成技術の研究、オープンソースモデルを用いた学習と二次開発。
© 著作権表示
記事の著作権 AIシェアリングサークル 無断転載はご遠慮ください。
関連記事
コメントはありません




