Introdução geral
A Stable Diffusion WebUI Forge é uma plataforma criada com base na Stable Diffusion WebUI (versão Gradio) para simplificar o processo de desenvolvimento, otimizar o gerenciamento de recursos e acelerar o processamento de inferências. Os recursos suportados pelo Forge incluem aceleração de raciocínio por GPU, otimização do gerenciamento de recursos, novas maneiras de simplificar a integração de patches da UNet, conveniência de desenvolvimento estendido e gerenciamento automatizado de recursos. Além disso, os desenvolvedores forneceram exemplos de extensões ControlNet para ajudar os usuários a desenvolver seus próprios recursos.
Lista de funções
Aceleração de inferência de GPU
Otimização do gerenciamento de recursos
Patches da UNet: uma nova abordagem para a integração
Desenvolvimento fácil de extensões
Gerenciamento automatizado de recursos
Usando a Ajuda
Visite o repositório do GitHub para obter o código mais recente
Instale e execute de acordo com a documentação
Geração de imagens com o Stable Diffusion WebUI Forge
Desenvolvimento de extensões personalizadas com patches UNet e exemplos de ControlNet
Em comparação com a WebUI original (para inferência SDXL a 1024 px), você pode esperar os seguintes aumentos de velocidade:
Se você estiver usando uma GPU comum, como 8 GB de RAM, poderá esperar um aumento na velocidade de inferência (it/s) de ~30~45%, o pico de memória da GPU (no Gerenciador de Tarefas) cairá de ~700 MB para 1,3 GB, a resolução máxima de difusão (onde não ocorre perda de memória) aumentará de ~2x a 3x e o tamanho máximo do lote de difusão (onde não ocorre perda de memória) aumentará de 4 a 6 vezes. A resolução máxima de difusão (sem ocorrência de perda de memória) aumentará em um fator de cerca de 2 a 3, e o tamanho máximo do lote de difusão (sem ocorrência de perda de memória) aumentará em um fator de cerca de 4 a 6.
Se você estiver usando uma GPU de desempenho inferior, como 6 GB de RAM, poderá esperar um aumento na velocidade de inferência (it/s) de ~60~75%, o pico de memória da GPU (no Gerenciador de Tarefas) cairá de ~800 MB para 1,5 GB, a resolução máxima de difusão (sem ocorrências fora da memória) aumentará em ~3x e o tamanho máximo do lote de difusão (sem ocorrências fora da memória) aumentará em cerca de 4 vezes. A resolução máxima de difusão (sem ocorrências fora da memória) aumentará em um fator de cerca de 3, e o tamanho máximo do lote de difusão (sem ocorrências fora da memória) aumentará em um fator de cerca de 4.
Se estiver usando uma GPU de alto desempenho, como a 4090, com 24 GB de memória de vídeo, você pode esperar um aumento na velocidade de inferência (it/s) de cerca de 3~6%, os picos de memória da GPU (no Gerenciador de tarefas) cairão de cerca de 1 GB para 1,4 GB, a resolução máxima de difusão (sem ocorrências fora da memória) aumentará em um fator de cerca de 1,6 e o tamanho máximo do lote de difusão (sem fora da memória) aumentará em cerca de 2x.
Se você usar o ControlNet com o SDXL, a contagem máxima do ControlNet (sem perda de memória) será aumentada em cerca de 2 vezes, e a velocidade com o SDXL+ControlNet será aumentada em cerca de 30~45%.
Outra mudança muito importante trazida pelo Forge é o Unet Patcher. Usando o Unet Patcher, métodos como Self-Attention Guidance, Kohya High Res Fix, FreeU, StyleAlign, Hypertile etc. podem ser implementados em cerca de 100 linhas de código. usando o Unet Patcher.
Graças ao Unet Patcher, muitas coisas novas agora são possíveis e compatíveis com o Forge, incluindo SVD, Z123, adaptador de IP com máscara, controlnet com máscara, photomaker e muito mais.
Não há mais monkeypatching da UNet ou conflito com outras extensões!
O Forge também adicionou vários samplers, incluindo, entre outros, DDPM, DDPM Karras, DPM++ 2M Turbo, DPM++ 2M SDE Turbo, LCM Karras, Euler A Turbo e outros (o LCM está no webui original desde a versão 1.7.0).