Stable Diffusion WebUI Forge : Modèles de génération d'images optimisés et accélérés

Dernières ressources sur l'IAPosté il y a 11 mois Cercle de partage de l'IA

13.9K 00

Introduction générale

L'interface Web de diffusion stable Forge est une plateforme construite sur l'interface Web de diffusion stable (version Gradio) afin de simplifier le processus de développement, d'optimiser la gestion des ressources et d'accélérer le traitement des inférences. Elle fournit un certain nombre d'accélérations et d'optimisations que l'on ne trouve pas dans l'interface WebUI d'origine. Les fonctionnalités prises en charge par Forge comprennent l'accélération du raisonnement par le GPU, l'optimisation de la gestion des ressources, de nouvelles façons de simplifier l'intégration des correctifs UNet, un confort de développement étendu et une gestion automatisée des ressources. En outre, les développeurs ont fourni des exemples d'extensions ControlNet pour aider les utilisateurs à développer leurs propres fonctionnalités.

Stable Diffusion WebUI Forge：优化并加速过的图像生成模型

Liste des fonctions

Accélération de l'inférence par le GPU
Optimisation de la gestion des ressources
Patchs UNet : une nouvelle approche de l'intégration
Développement facile d'extensions
Gestion automatisée des ressources

Utiliser l'aide

Visitez le dépôt GitHub pour le code le plus récent
Installer et exécuter conformément à la documentation
Génération d'images avec diffusion stable WebUI Forge
Développement d'extensions personnalisées à l'aide de correctifs UNet et d'exemples ControlNet

Par rapport à l'interface WebUI originale (pour l'inférence SDXL à 1024px), vous pouvez vous attendre aux accélérations suivantes :

Si vous utilisez un GPU courant, par exemple 8 Go de RAM, vous pouvez vous attendre à une augmentation de la vitesse d'inférence (it/s) de ~30~45%, la mémoire maximale du GPU (dans le gestionnaire des tâches) passera de ~700 Mo à 1,3 Go, la résolution de diffusion maximale (sans sortie de mémoire) augmentera de ~2x à 3x, et la taille maximale des lots de diffusion (sans sortie de mémoire) augmentera d'un facteur d'environ 2 à 3, et la taille maximale des lots de diffusion (sans sortie de mémoire) augmentera d'un facteur d'environ 4 à 6. La résolution maximale de diffusion (sans sortie de mémoire) augmentera d'un facteur d'environ 2 à 3, et la taille maximale des lots de diffusion (sans sortie de mémoire) augmentera d'un facteur d'environ 4 à 6.

Si vous utilisez un GPU moins performant comme 6 Go de RAM, vous pouvez vous attendre à une augmentation de la vitesse d'inférence (it/s) de ~60~75%, la mémoire GPU maximale (dans le gestionnaire de tâches) passera de ~800 Mo à 1,5 Go, la résolution de diffusion maximale (sans sorties de mémoire) augmentera de ~3x, et la taille maximale des lots de diffusion (sans sorties de mémoire) augmentera d'un facteur d'environ 3, et la taille maximale des lots de diffusion (sans sorties de mémoire) augmentera d'un facteur d'environ 4. La résolution maximale de diffusion (sans sortie de mémoire) sera multipliée par 3 environ, et la taille maximale des lots de diffusion (sans sortie de mémoire) sera multipliée par 4 environ.

Si vous utilisez un GPU haute performance comme le 4090 avec 24 Go de mémoire vidéo, vous pouvez vous attendre à une augmentation de la vitesse d'inférence (it/s) d'environ 3~6%, la mémoire maximale du GPU (dans le gestionnaire de tâches) passera d'environ 1 Go à 1,4 Go, la résolution de diffusion maximale (pas de sorties de mémoire) augmentera d'un facteur d'environ 1,6 et la taille maximale des lots de diffusion (pas de sorties de mémoire) augmentera d'environ 2 fois. sortie de mémoire) augmentera d'environ 2 fois.

Si vous utilisez ControlNet avec SDXL, le nombre maximum de ControlNet (sans sortie de mémoire) sera augmenté d'environ 2 fois, et la vitesse avec SDXL+ControlNet sera augmentée d'environ 30~45%.

Un autre changement très important apporté par Forge est le Unet Patcher, en utilisant le Unet Patcher, des méthodes comme Self-Attention Guidance, Kohya High Res Fix, FreeU, StyleAlign, Hypertile, etc. peuvent être implémentées en environ 100 lignes de code. en utilisant le Unet Patcher.

Grâce à Unet Patcher, beaucoup de nouvelles choses sont maintenant possibles et supportées dans Forge, y compris SVD, Z123, Ip-adapter masqué, controlnet masqué, photomaker et plus encore.

Plus de monkeypatching UNet ou de conflit avec d'autres extensions !

Forge a également ajouté un certain nombre d'échantillonneurs, y compris, mais sans s'y limiter, DDPM, DDPM Karras, DPM++ 2M Turbo, DPM++ 2M SDE Turbo, LCM Karras, Euler A Turbo, et plus encore (LCM est présent dans le webui original depuis la version 1.7.0).

Dernières ressources sur l'IA # AI Self-Deployment Image Generation Tool (outil de génération d'images pour l'autodéploiement de l'IA)

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Aqua Voice : Générer un texte précis grâce à la saisie vocale inter-applications

Dernières ressources sur l'IA # AI Speech to Text

il y a 5 mois

020K

AI reads books：AI逐页阅读PDF书籍，自动提取知识要点并生成总结

L'IA lit les livres : l'IA lit les livres PDF page par page, extrait automatiquement les points clés de la connaissance et génère des résumés.

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outil de résumé de texte AI et d'audio/vidéo

Il y a 8 mois

013.8K

EmailTree.ai : L'IA automatise la gestion de la boîte de réception, automatise les réponses aux courriels

Dernières ressources sur l'IA # AI Life Efficiency Assistant

Il y a 8 mois

011.3K

ReechoAI : Plateforme de synthèse vocale et de clonage instantané ultra-fausse IA

Dernières ressources sur l'IA # Clonage vocal AI

Il y a 11 mois

013.8K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Stable Diffusion WebUI Forge : Modèles de génération d'images optimisés et accélérés

Introduction générale

Liste des fonctions

Utiliser l'aide

Microsoft Loop : composant de synchronisation de documents et de collaboration, intégré de manière transparente à Microsoft 365.

Anatomy 360 : Tableau de référence de l'art corporel en 3D

Articles connexes

Aqua Voice : Générer un texte précis grâce à la saisie vocale inter-applications

L'IA lit les livres : l'IA lit les livres PDF page par page, extrait automatiquement les points clés de la connaissance et génère des résumés.

EmailTree.ai : L'IA automatise la gestion de la boîte de réception, automatise les réponses aux courriels

ReechoAI : Plateforme de synthèse vocale et de clonage instantané ultra-fausse IA

Pas de commentaires

Dernières collections

Derniers articles

Stable Diffusion WebUI Forge : Modèles de génération d'images optimisés et accélérés

Introduction générale

Liste des fonctions

Utiliser l'aide

Microsoft Loop : composant de synchronisation de documents et de collaboration, intégré de manière transparente à Microsoft 365.

Anatomy 360 : Tableau de référence de l'art corporel en 3D

Articles connexes

Aqua Voice : Générer un texte précis grâce à la saisie vocale inter-applications

L'IA lit les livres : l'IA lit les livres PDF page par page, extrait automatiquement les points clés de la connaissance et génère des résumés.

EmailTree.ai : L'IA automatise la gestion de la boîte de réception, automatise les réponses aux courriels

ReechoAI : Plateforme de synthèse vocale et de clonage instantané ultra-fausse IA

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles