はじめに
Stable Diffusion WebUI Forgeは、開発プロセスを簡素化し、リソース管理を最適化し、推論処理を高速化するために、Stable Diffusion WebUI(Gradioバージョン)上に構築されたプラットフォームです。Forgeがサポートする機能には、GPU推論アクセラレーション、リソース管理の最適化、UNetパッチの統合を簡素化する新しい方法、拡張された開発利便性、自動化されたリソース管理などがあります。さらに、開発者は、ユーザーが独自の機能を開発するのに役立つサンプルControlNet拡張機能を提供しています。
機能一覧
GPU推論アクセラレーション
リソース管理の最適化
UNetパッチ:統合への新しいアプローチ
簡単な拡張機能開発
リソース管理の自動化
ヘルプの使用
最新のコードはGitHubリポジトリへ
ドキュメントに従ってインストールし、実行する
安定した拡散による画像生成 WebUI Forge
UNetパッチとControlNetの例によるカスタム拡張機能の開発
オリジナルのWebUI(1024pxでのSDXL推論)と比較して、以下のスピードアップが期待できます:
8GBのRAMなど一般的なGPUを使用している場合、推論速度(it/s)は~30~45%の向上が期待でき、ピークGPUメモリ(タスクマネージャ)は~700MBから1.3GBに減少し、最大拡散解像度(メモリ不足が発生しない)は~2倍から3倍に増加し、最大拡散バッチサイズ(メモリ不足が発生しない)は~4倍から6倍に増加します。最大拡散解像度(メモリ不足が発生しない)は約2倍から3倍増加し、最大拡散バッチサイズ(メモリ不足が発生しない)は約4倍から6倍増加する。
6GBのRAMのような低性能GPUを使用している場合、推論速度(it/s)は~60~75%増加し、GPUメモリスパイク(タスクマネージャ)は~800MBから1.5GBに減少し、最大拡散解像度(メモリ外発生なし)は~3倍に増加し、最大拡散バッチサイズ(メモリ外発生なし)は~4倍に増加すると予想されます。最大拡散解像度(メモリ外発生なし)は約3倍増加し、最大拡散バッチサイズ(メモリ外発生なし)は約4倍増加する。
24GBのビデオメモリを搭載した4090のような高性能GPUを使用している場合、推論速度(it/s)は約3~6%向上し、ピークGPUメモリ(タスクマネージャ)は約1GBから1.4GBに減少し、最大拡散解像度(メモリ不足の発生なし)は約1.6倍に増加し、最大拡散バッチサイズ(メモリ不足の発生なし)は約2倍に増加します。最大拡散バッチサイズ(メモリ不足の発生なし)が約2倍に増加する。
SDXLでControlNetを使用する場合、ControlNetの最大カウント数(メモリ不足なし)は約2倍になり、SDXL+ControlNetの速度は約30~45%向上します。
Unet Patcherを使用することで、Self-Attention Guidance、Kohya High Res Fix、FreeU、StyleAlign、Hypertileなどのメソッドを約100行のコードで実装することができます。Unet Patcherを使用することで
Unet Patcherのおかげで、SVD、Z123、マスクされたIpアダプター、マスクされたコントロールネット、フォトメーカーなど、多くの新しいことが可能になり、Forgeでサポートされるようになりました。
UNetのモンキーパッチや他の拡張機能とのコンフリクトはもうない!
Forgeはまた、DDPM、DDPM Karras、DPM++ 2M Turbo、DPM++ 2M SDE Turbo、LCM Karras、Euler A Turboなど(ただしこれらに限定されない)、数多くのサンプラーを追加しました(LCMは1.7.0からオリジナルのwebuiに含まれています)。