Interface web de génération de texte : interface de chat basée sur un grand modèle de langage Gradio avec prise en charge de plusieurs services dorsaux.

Dernières ressources sur l'IAMise à jour il y a 10 mois Cercle de partage de l'IA

20.3K 00

Introduction générale

L'interface web de génération de texte est une interface web basée sur Gradio et conçue pour le Grand Modèle de Langage (LLM). Elle prend en charge une variété de backends de génération de texte, y compris Transformers, llama.cpp et ExLlamaV2. Les utilisateurs peuvent rapidement déployer et utiliser l'outil pour des tâches de génération de texte grâce à des étapes d'installation simples.

Text generation web UI：基于 Gradio 大语言模型聊天界面，支持多种后端服务

Liste des fonctions

Prise en charge de plusieurs modèlesSupport de Transformers, llama.cpp, ExLlamaV2 et de nombreux autres backends de génération de texte.
Formatage automatique de l'inviteLes modèles de Jinja2 permettent de formater automatiquement les conseils.
Modes de discussion multiplesLes modes de discussion sont l'instruction, l'instruction par chat et le chat.
Historique du chat: Permet de passer rapidement d'un dialogue à l'autre.
Génération de texte libreGénération de texte libre dans les onglets par défaut/carnet de notes, sans tenir compte des tours de chat.
Paramètres d'échantillonnage multiplesLes textes peuvent être générés à partir d'un grand nombre de paramètres d'échantillonnage et d'options de génération, ce qui permet un contrôle précis de la génération de texte.
Changement de modèleLes modèles d'ordinateurs de bureau sont plus faciles à utiliser que les modèles d'ordinateurs de bureau : on passe facilement d'un modèle à l'autre dans l'interface sans redémarrer.
Outil de mise au point de la LoRALoRA : Des outils simples de réglage fin de LoRA sont fournis.
Soutien étenduLe logiciel est compatible avec un large éventail d'extensions intégrées et fournies par l'utilisateur.

Utiliser l'aide

Processus d'installation

Cloner ou télécharger le référentiel: :

   git clone https://github.com/oobabooga/text-generation-webui
cd text-generation-webui

Exécuter un script correspondant au système d'exploitation: :
- Pour les utilisateurs de Linux : bash ./start_linux.sh
- Pour les utilisateurs de Windows : cmd start_windows.bat
- Pour les utilisateurs de macOS : bash ./start_macos.sh
- Pour les utilisateurs du WSL : bash ./start_wsl.bat
Sélectionner un fournisseur de GPUSélectionnez votre fournisseur de GPU : Suivez les invites pour sélectionner votre fournisseur de GPU.
accès au navigateurA la fin de l'installation, ouvrez le navigateur pour visiter le site suivant http://localhost:7860.

Lignes directrices pour l'utilisation

Interface de lancementAprès avoir exécuté le script de démarrage approprié, ouvrez votre navigateur et visitez le site Web de la Commission européenne. http://localhost:7860.
Sélectionner le modèleSélectionnez le modèle de génération de texte souhaité dans l'interface.
invite à la saisie: Saisissez votre mot clé dans le champ de saisie et sélectionnez les paramètres de génération.
Générer du texteCliquez sur le bouton Générer pour afficher le résultat du texte généré.
Mode de commutationMode d'instruction : Basculer entre les modes d'instruction, d'instruction par chat et de chat en fonction des besoins.
Voir l'historiqueHistorique : Le menu "Historique" permet de passer rapidement d'une conversation à l'autre.
Fonctionnalité étendueLes services d'assistance à la clientèle : Installer et activer les extensions nécessaires pour améliorer les fonctionnalités.

Fonctionnement détaillé

Formatage automatique de l'inviteLes invites sont automatiquement formatées à l'aide du modèle Jinja2 pour s'assurer qu'elles sont conformes au modèle.
Paramètres d'échantillonnage multiplesLes utilisateurs peuvent ajuster des paramètres tels que la température, la longueur maximale et les pénalités de répétition pour contrôler le style et la longueur du texte généré.
Génération de texte libreDans les onglets par défaut/carnet de notes, les utilisateurs peuvent effectuer une génération de texte libre, non limitée aux tours de chat, adaptée aux tâches de génération de texte long.
Mise au point de la LoRALes utilisateurs peuvent affiner le modèle à l'aide de l'outil LoRA intégré afin d'améliorer la génération de tâches spécifiques.
Soutien étenduEn installant des extensions, les utilisateurs peuvent ajouter des fonctions supplémentaires telles que la synthèse vocale, la génération d'images, etc.