はじめに
InfiniteYouは、ByteDance Intelligent Creation Teamによって開発されたオープンソースプロジェクトです。拡散トランスフォーマー(DiTs)テクノロジーをベースにしており、以下のような特徴があります。 フラックス.1-devモデルの核となる機能は、ユーザーが写真をアップロードし、テキスト説明を入力することで、人物の身元を保持したまま新しい画像を生成できるようにすることである。InfiniteYouは2025年3月にコード、モデル、オンラインデモとともにリリースされ、技術コミュニティから注目を集めている。複数のプラグインをサポートし、開発者、研究者、一般ユーザーが簡単に使用できる。
機能一覧
- アイデンティティ維持のための改造写真と説明文をアップロードすると、新しい画像が生成され、人物の顔の特徴が維持されます。
- 高画質画像生成クリアな映像を出力し、ブレや手の歪みなどを軽減します。
- テキスト配置の最適化バイアスを避けるため、記述内容と整合性の高い結果を生成します。
- モデルの選択提供
aes_stage2
(美学が優先される)とsim_stage1
(最初にアイデンティティ)2つのモード。 - プラグイン拡張機能ControlNet、LoRA、IP-Adapterなどをサポート。
ヘルプの使用
設置プロセス
InfiniteYouを使用するにはローカルインストールが必要です。以下はその詳細な手順です:
- 環境準備
- Python 3.8以降がシステムにインストールされていることを確認してください。
- コードをダウンロードするためにGitをインストールする。
- NVIDIA GPUとCUDAは、世代速度を向上させるために推奨されています。
- クローンコード
それをターミナルに入力する:
git clone https://github.com/bytedance/InfiniteYou.git
カタログを見る
cd InfiniteYou
- 依存関係のインストール
以下のコマンドを実行して、必要なライブラリをインストールする:
pip install -r requirements.txt
GPUを使用している場合は、対応するPyTorchのバージョンをインストールする必要があります:
pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
- ダウンロードモデル
ダウンロードは https://huggingface.co/ByteDance/InfiniteYou をご覧ください。infu_flux_v1.0
フォルダにあるaes_stage2
もしかしたらsim_stage1
モデルをプロジェクト・ディレクトリの対応する場所に置く。 - ランニング・デモ
グラディオをインストールする:
pip install gradio
ローカル・インターフェイスを起動する:
python app.py
ブラウザが開きます http://127.0.0.1:7860
|にできるようにあなたがそれをすることができます本当に出くわすことあなたは、実際には私たち約束、誰でも素早くはちょうど無視これらの一見正確にどのように{}人のことを忘れることができます。
主な機能
アイデンティティの保存 写真の復元
- 写真のアップロード
Gradioのインターフェイスで、"Upload Identity Image "をクリックし、顔の鮮明な写真を選択する。 - 入力内容
プロンプト・テキスト」ボックスに具体的な説明を入力する。 - パラメータの設定
- モデル選択:
aes_stage2
美学を重視する。sim_stage1
アイデンティティの類似性を重視。 - パラメーター調整:デフォルト
infusenet_conditioning_scale
というのも1.0
属infusenet_guidance_start
というのも0.0
.アイデンティティが十分に似ていない場合は、後者を0.1
. - シード値(Seed):デフォルトのままか、手動で設定する。
- 画像の生成
Generate "をクリックし、結果が画面に表示されるまで約120秒待つ。
迅速なスクリプト推論
ターミナルで実行:
python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results
生成された結果は results
フォルダー
オンラインデモ
https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX、インストールなしでお試しください。
プラグイン使用
- コントロールネット結果を生成するアクションを制御するために、ポーズ参照画像をアップロードします。
- LORARealismとAnti-blurプラグインがサポートされています。
<path_to_lora>
. - IPアダプター: スタイルの参考表を追加して、自分だけのスタイリングに。
操作例
あなたは「会議室にいるスーツ姿の男性」のイメージを生成したい:
- 男性の写真をアップロードする。
- 説明文を入力:「会議室にいるスーツ姿の男性」。
- オプション
aes_stage2
生成」をクリックする。 - 結果を確認し、性別を調整する必要があれば「男」という言葉を加える。
ほら
- 写真は遮蔽物を避けるため、鮮明で正面を向いていること。
- 説明は具体的にし、「美しい」などの曖昧な言葉は避けること。
- 生成時間はハードウェアによって異なり、GPUの場合は30~60秒と短い。
アプリケーションシナリオ
- ソーシャルメディア・コンテンツ
ユーザーは自撮り写真をアップロードし、「ジムで体操服を着ている」と入力すると、フィットネスをテーマにした写真が生成され、共有できる。 - アート
アーティストは「中世の衣装を着た騎士」を描いた肖像画をアップロードし、コンセプト・デザインを生成する。 - 研究試験
研究者たちは、InfiniteYouを使ってアイデンティティ保持効果を比較し、生成されたモデルの性能を検証した。
品質保証
- 無料ですか?
はい。コードとモデルはオープンソースであり、学術研究のために無料で使用できる。 - 発電にかかる時間は?
平均120秒、GPUの方が速い。 - マルチプレイヤーフォトに対応していますか?
現在はシングルプレーヤー用に最適化されており、マルチプレーヤーのサポートにはさらなる開発が必要だ。