Kolors: 高品質画像生成のためのテキスト画像変換モデル、中国語ポスター生成もサポート

2.8K 00

はじめに

Kolorsは、Racerチームによって開発された、ポテンシャル拡散技術に基づく大規模なテキスト画像生成モデルです。Kolorsは、ビジュアル品質、複雑な意味精度、テキストレンダリングにおいて大きな優位性を示し、バーチャル試着、画像復元、パーソナライズ画像生成など、様々なアプリケーションシナリオに適しています。

機能一覧

テキストから画像への変換テキスト説明文を入力し、高品質の画像を生成します。
多言語サポート中国語と英語の入力をサポートし、対応する言語の画像を生成します。
バーチャル試着バーチャル試着機能を提供。
画像修復画質を向上させるために、画像の細部を修復し、洗練させます。
パーソナライズされた画像生成ユーザーの要求に応じてパーソナライズされた画像を生成します。
モデルの訓練と推論二次開発を促進するために、モデルのトレーニングと推論コードを提供する。

ヘルプの使用

設置プロセス

環境準備::
- Python 3.8以降をインストールする。
- PyTorch 1.13.1以降をインストールする。
- Transformers 4.26.1以降をインストールする。
- CUDA 11.7以上を推奨。
リポジトリをクローンし、依存関係をインストールする::

   apt-get install git-lfs git
git clone https://github.com/Kwai-Kolors/Kolors
cd Kolors
conda create --name kolors python=3.8
conda activate kolors
pip install -r requirements.txt
python3 setup.py install

モデルウェイトのダウンロード::

   huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors

使用プロセス

テキストから画像への変換::
- 以下のコマンドを実行して画像を生成する：
```
 python3 scripts/sample.py "一张瓢虫的照片，微距，变焦，高质量，电影，拿着一个牌子，写着‘可图’"
```
- 生成された画像はscripts/outputs/sample_test.jpg.
ディフューザーの使用::
- 協議ディフューザー使用説明書.
バーチャル試着::
- Kolorsのバーチャル試着ページにアクセスし、写真をアップロードして洋服のスタイルを選択すると、試着できるものを見ることができる。
画像修復::
- Kolorsが提供する画像修復機能を使用して、修復する画像をアップロードすると、システムが自動的に画像の詳細を修復します。
パーソナライズされた画像生成::
- お客様の個人的な要望を入力すると、Kolorsが説明に基づいて適合画像を生成します。