はじめに
UltraPixelは、非常に高品質で詳細な画像を作成するために設計された高度な超高解像度画像生成技術です。GitHubユーザーのcatcathh氏によって開発され、NeurIPS 2024で発表されたUltraPixelは、1Kから6Kまでのあらゆる解像度の画像生成をサポートし、その結果は ミッドジャーニー と『DALL-E 3』では、画像生成の品質とディテールが大幅に改善された。
- 高解像度画像生成 1Kから6Kまで、あらゆる解像度の画像生成に対応。
- 複数モデルのサポート 様々な事前学習モデルが用意されているので、ユーザーは必要に応じて適切なモデルを選択することができます。
- テキストガイド付き画像生成 詳細なテキスト説明付きの高品質の画像を生成します。
- グラディオ・インターフェイス 画像生成操作を容易にするGradioインターフェースを提供。
- 効率的なメモリ管理 メモリ・リソースを節約するため、タイル・デコードをサポート。
ヘルプの使用
設置プロセス
- 依存関係のインストール 以下のコマンドを実行して、必要な依存関係をインストールしてください:
pip install -r requirements.txt
- 訓練済みモデルのダウンロード READMEファイルのリンクに従って、事前にトレーニングされたモデルをダウンロードし、それを
モデル
カタログ - ウルトラピクセル仕様書をダウンロード 提供されたリンクからUltraPixelの新しいパラメータをダウンロードし、それを
モデル
カタログ - をとおしてこちらUltraPixelの新しいパラメータをダウンロードする。
- モデル一覧:https://github.com/catcathh/UltraPixel/blob/main/models/models_checklist.txt
使用プロセス
- テキストガイド付き画像生成 ::
- 以下のコマンドを実行し、Gradioインターフェイスを起動する:
CUDA_VISIBLE_DEVICES=0 python app.py
- あるいは、以下のコマンドを実行するだけで、画像が生成される:
CUDA_VISIBLE_DEVICES=0 python inference/test_t2i.py
- ヒント:美しい画像を作成するためには、被写体、背景、色、光、雰囲気を詳細に描写し、「高品質」、「ディテールが豊か」、「8k"、"フォトリアリスティック"、"シネマティックライティング "などの高品質な修飾語を使用します。例えば
穏やかな山々を背景に、鮮やかなオレンジと紫で埋め尽くされた空、高品質、素晴らしいディテール、8K、フォトリアリスティック、映画のような照明、完璧。
- 以下のコマンドを実行し、Gradioインターフェイスを起動する:
- メモリ管理 ::
- メモリリソースを節約するために、以下のように
--stage_a_tiled
パラメーター
- メモリリソースを節約するために、以下のように
サンプルヒント
- パーソナライズされた猫の画像を生成する ::
パーソナライゼーション・モデルをダウンロードし、以下のコマンドを実行してパーソナライゼーション結果を生成します:
CUDA_VISIBLE_DEVICES=0 python inference/test_t2i.py --model_path path_to_personalized_model
ワンクリックインストールパッケージ
グラフィックカードは16G以下、メモリは40G以下ではありません。