オストリスによるAIツールキット：FLUX.1モデルトレーニングツールキットによる安定した拡散

30.3K 00

はじめに

AI Toolkit by Ostrisは、Stable DiffusionとFLUX.1モデルの学習と画像生成タスクのサポートに特化したオープンソースのAIツールセットです。開発者のOstrisによって作成・保守され、GitHubでホストされているこのツールキットは、研究者や開発者がモデルの微調整や実験を行うための柔軟なプラットフォームを提供することを目的としています。LoRA抽出、バッチ画像生成、レイヤー別トレーニングなどの機能をサポートする様々なAIスクリプトが含まれている。このプロジェクトは現在開発段階にあり、一部の機能は十分に安定していない可能性があるが、カスタマイズ性が高いため、ディープラーニング分野の上級ユーザーに適している。ツールセットはLinuxとWindowsシステムをサポートしており、FLUX.1モデル学習を実行するには、少なくとも24GBのビデオメモリを搭載したNvidia GPUが必要である。

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

機能一覧

モデルトレーニング:: LoRAとLoKrモデルをトレーニングするためのStable DiffusionとFLUX.1モデルの微調整をサポート。
画像生成プロファイルやテキストプロンプトに基づいて画像を一括生成します。
LoRAの抽出と最適化モデルの特徴抽出を最適化するLoRAとLoCON抽出ツールを提供。
レイヤー別トレーニング特定のニューラルネットワークのレイヤーを選択し、柔軟に重みを調整することができます。
ユーザーインターフェースのサポートAIツールキットUIとGradio UIを提供し、タスク管理とモデルトレーニング操作を簡素化。
データセット処理画像の解像度を自動的に調整し、バケツごとに画像をグループ化します。
クラウドトレーニングRunPodとModalプラットフォームでのトレーニングタスクの実行をサポート。

ヘルプの使用

設置プロセス

Linuxシステムのインストール

クローン倉庫ターミナルで以下のコマンドを実行し、コードをダウンロードする：

git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit

サブモジュールの更新依存するライブラリがすべて揃っていることを確認する：

git submodule update --init --recursive

仮想環境の構築Python 3.10以降を使用してください：

python3 -m venv venv
source venv/bin/activate

依存関係のインストール最初にPyTorchをインストールし、次に他の依存関係をインストールします：

pip3 install torch
pip3 install -r requirements.txt

Windowsシステムのインストール

クローン倉庫コマンドプロンプトで実行：

git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit

サブモジュールの更新:

git submodule update --init --recursive

仮想環境の構築:

python -m venv venv
.\venv\Scripts\activate

依存関係のインストールCUDA 12.4をサポートするバージョンのPyTorchをインストールし、その他の依存関係をインストールします：

pip install torch==2.5.1 torchvision==0.20.1 --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt

UIインターフェイスのインストール

Node.jsのインストールNode.js 18以降がインストールされていることを確認してください。
UIの構築ui ディレクトリに入り、依存関係をインストールする：

cd ui
npm install
npm run build
npm run update_db

UIの実行起動画面：

npm run start

UIへのアクセスブラウザで入力http://localhost:8675.

主な機能

FLUX.1モデルのトレーニング

環境を整えるディスプレイ出力に使用する場合は、コンフィギュレーションファイルで設定してください。low_vram: trueCPU上のモデルを定量化する。
FLUX.1-devの設定:

ハギング・フェイスにログインBLACK-forest-labs/FLUX.1-devそしてライセンスを受け入れる。
プロジェクトのルート・ディレクトリに.envファイルにHF_TOKEN=你的读取密钥.

FLUX.1の設定:

設定ファイルを編集する（例えばtrain_lora_flux_schnell_24gb.yaml)を加える：

model:
name_or_path: "black-forest-labs/FLUX.1-schnell"
assistant_lora_path: "ostris/FLUX.1-schnell-training-adapter"
is_flux: true
quantize: true
sample:
guidance_scale: 1
sample_steps: 4

データセットの準備ルートディレクトリに作成datasetフォルダを.jpgそして.jpegもしかしたら.png画像と対応する.txtファイルを記述する。
設定ファイルの編集リプロダクションconfig/examples/train_lora_flux_24gb.yamlまでconfigディレクトリの名前をmy_config.yml修正folder_pathはデータセットのパスである。
ランニング・トレーニング:: 実装：

python run.py config/my_config.yml

トレーニング結果は指定された出力フォルダに保存され、Ctrl+Cで一時停止し、最も近いチェックポイントから再開することができます。

Gradio UIを使ったトレーニング

ハギング・フェイスにログインランニングhuggingface-cli loginインプットにはwrite特権の鍵
ローンチUI:: 実装：

python flux_train_ui.py

オペレーションUI画像をアップロードし、説明を記入し、パラメータを設定して、インターフェイスでトレーニングをクリックします。

クラウドでのトレーニング（RunPod）

RunPodインスタンスの作成テンプレートの使用runpod/pytorch:2.2.0-py3.10-cuda12.1.1-devel-ubuntu22.04A40（ビデオメモリ48GB）を選択。
インストレーション・ツールセットJupyter Notebookに接続し、ターミナルでLinux installコマンドを実行する。
データセットのアップロードルートディレクトリに作成datasetフォルダに画像と説明ファイルをドラッグします。
設定と実行の設定ファイルを修正する。folder_path実施python run.py config/my_config.yml.

データセットの準備

フォーマット要件サポート.jpgそして.jpegそして.pngフォーマットでは、説明ファイルは.txtファイル名は統一する必要がある（例えばimage1.jpgカウンターパーツimage1.txt).
説明: .txtに記述する。[trigger]プレースホルダーは、設定ファイルのtrigger_word交換。
自動調整ズームはサポートされていません。

レイヤー別トレーニング

設定ファイルの編集でnetwork一部追加：

network:
type: "lora"
linear: 128
linear_alpha: 128
network_kwargs:
only_if_contains:
- "transformer.single_transformer_blocks.7.proj_out"
- "transformer.single_transformer_blocks.20.proj_out"

ランニング・トレーニング指定されたレイヤーのみをトレーニングする。

ほら

トレーニングの中断チェックポイントの保存中にCtrl+Cを押すのは、ファイルの破損を防ぐために避けてください。
UIセキュリティUIは現在Linux上でのみテストされているが、安全性が低く、パブリック・ネットワークに公開することは推奨されない。
ヘルプを得るオストリスの Discord コミュニティに参加すれば、開発者に直接プライベートメッセージを送らずに済みます。

LiteAvatar：CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

8ヶ月前

029.5K

AI-Scientist-v2：自律的な科学研究と論文執筆

最新のAIリソース # 詳細な調査レポートの作成 #論文

6ヶ月前

028.4K

Mindsera - ユーザーのテキストを解析し、根底にある感情を明らかにするAI日記ツール

最新のAIリソース

4ヶ月前

019K

GroundX: 錯覚のない実データに基づくRAG（検索機能拡張）APIの構築

9ヶ月前

023.7K

コメントなし

コメントに参加するにはログインが必要です！

今すぐログイン

コメントはありません

オストリスによるAIツールキット：FLUX.1モデルトレーニングツールキットによる安定した拡散

はじめに

機能一覧

ヘルプの使用

設置プロセス

Linuxシステムのインストール

Windowsシステムのインストール

UIインターフェイスのインストール

主な機能

FLUX.1モデルのトレーニング

Gradio UIを使ったトレーニング

クラウドでのトレーニング（RunPod）

データセットの準備

レイヤー別トレーニング

ほら

MUAH.AI: リアルタイムの音声通話と無制限のインタラクションを備えたAIガールフレンド

Flycount JavaAI：完全なJavaプロジェクトコードを一文で生成する

関連記事

LiteAvatar：CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

AI-Scientist-v2：自律的な科学研究と論文執筆

Mindsera - ユーザーのテキストを解析し、根底にある感情を明らかにするAI日記ツール

GroundX: 錯覚のない実データに基づくRAG（検索機能拡張）APIの構築

コメントなし

最新コレクション

最新記事

オストリスによるAIツールキット：FLUX.1モデルトレーニングツールキットによる安定した拡散

はじめに

機能一覧

ヘルプの使用

設置プロセス

Linuxシステムのインストール

Windowsシステムのインストール

UIインターフェイスのインストール

主な機能

FLUX.1モデルのトレーニング

Gradio UIを使ったトレーニング

クラウドでのトレーニング（RunPod）

データセットの準備

レイヤー別トレーニング

ほら

MUAH.AI: リアルタイムの音声通話と無制限のインタラクションを備えたAIガールフレンド

Flycount JavaAI：完全なJavaプロジェクトコードを一文で生成する

関連記事

LiteAvatar：CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

AI-Scientist-v2：自律的な科学研究と論文執筆

Mindsera - ユーザーのテキストを解析し、根底にある感情を明らかにするAI日記ツール

GroundX: 錯覚のない実データに基づくRAG（検索機能拡張）APIの構築

コメントなし

厳選されたAIツール

最新コレクション

最新記事