Kiln : Outil simple de mise au point de modèles LLM et de synthèse de données, base de code 0 pour mettre au point vos propres mini-modèles !
Introduction générale
Kiln est un outil open source axé sur le réglage fin des grands modèles linguistiques (LLM), la génération de données synthétiques et la collaboration d'ensembles de données. Il fournit une application de bureau intuitive avec prise en charge des systèmes Windows, MacOS et Linux qui permet aux utilisateurs d'affiner des modèles tels que Llama, GPT4o et Mixtral avec zéro code et d'automatiser les déploiements sans serveur.Kiln prend également en charge la génération de données d'entraînement par le biais d'un outil de visualisation interactif qui fournit un contrôle de version basé sur Git pour faciliter le travail d'équipe et la collaboration. Kiln prend également en charge la génération de données de formation par le biais d'outils de visualisation interactifs et fournit un contrôle de version basé sur Git pour une collaboration d'équipe sur des données structurées. Sa bibliothèque Python ouverte et son API REST OpenAPI permettent aux développeurs d'intégrer facilement les ensembles de données Kiln dans leurs flux de travail.


Liste des fonctions
- Applications bureautiques intuitivesLa solution est compatible avec les systèmes Windows, MacOS et Linux grâce à une installation en un seul clic et à une conception intuitive.
- Mise au point du code zéroLa version française de l'outil : prend en charge le réglage fin de modèles tels que Llama, GPT4o et Mixtral, avec un déploiement automatique sans serveur.
- Génération de données synthétiquesLes données de formation : générer des données de formation à l'aide d'outils de visualisation interactifs.
- Travail d'équipeLe contrôle de version basé sur Git permet aux membres de l'équipe de collaborer sur les ensembles de données.
- Génération de conseilsLes données peuvent être utilisées pour générer automatiquement des invites, y compris des invites de type chaînette, sous-échantillonnage et multi-échantillon.
- Modélisation étendue et soutien aux fournisseursSupport pour Ollama, OpenAI, OpenRouter, Fireworks, Groq, AWS et plus encore.
- Bibliothèques et API open source: Fournit la bibliothèque Python open source du MIT et l'API REST OpenAPI.
- le respect de la vie privée d'abordLes données de l'utilisateur sont totalement privées, avec une prise en charge des opérations locales et des clés d'API autonomes.
- Soutien aux données structurées: Construire des tâches d'intelligence artificielle compatibles avec JSON.
- Utilisation gratuiteLes applications de bureau sont gratuites et les bibliothèques open source sont ouvertes.
Utiliser l'aide
Processus d'installation
- Télécharger le dossier de candidaturePour ce faire, vous devez : visiter la page GitHub de Kiln et sélectionner le téléchargement de l'installateur approprié pour votre système d'exploitation.
- Installation des applications: :
- Windows (ordinateur)Exécutez le fichier .exe téléchargé et suivez l'assistant d'installation pour terminer l'installation.
- MacOSTélécharger le fichier .dmg, l'ouvrir et faire glisser Kiln dans le dossier Applications.
- LinuxTélécharger le fichier .tar.gz, le décompresser et exécuter le script d'installation.
Lignes directrices pour l'utilisation
- Lancer l'applicationUne fois l'installation terminée, ouvrez l'application de bureau Kiln.
- Affiner le modèle: :
- Sélectionnez le module de fonction "Fine tuning".
- Sélectionnez le modèle à affiner (par exemple, Llama, GPT4o, Mixtral).
- Téléchargez des données d'entraînement ou créez un ensemble de données à l'aide de l'outil de génération de données synthétiques de Kiln.
- Configurez les paramètres de réglage fin et cliquez sur "Démarrer le réglage fin".
- Une fois la mise au point terminée, le modèle est automatiquement déployé sans aucune autre action.
- Générer des données synthétiques: :
- Sélectionnez le module de fonction "Génération de données synthétiques".
- Créer et modifier des données de formation à l'aide d'outils de visualisation interactifs.
- Sauvegarder l'ensemble des données générées en vue d'une mise au point ultérieure.
- Travail d'équipe: :
- Sélectionnez le module fonctionnel Dataset Collaboration.
- Utiliser le contrôle de version Git pour gérer les ensembles de données et faciliter la collaboration entre les membres de l'équipe.
- Fournir des exemples, des conseils, des commentaires et d'autres informations sur l'ensemble de données afin de faciliter le travail des membres de l'équipe.
- Génération de conseils: :
- Sélectionnez le module de fonction Génération d'invites.
- Téléchargez l'ensemble de données et sélectionnez le type d'invite (par exemple, réflexion en chaîne, moins d'échantillons, plusieurs échantillons).
- Génération automatique de conseils pour l'apprentissage et l'inférence de modèles.
- Intégration dans le flux de travail: :
- Intégrez les ensembles de données et les fonctionnalités de Kiln dans vos propres flux de travail à l'aide de la bibliothèque Python de Kiln et de l'API REST OpenAPI.
- Reportez-vous à la documentation et aux exemples de code de Kiln pour démarrer rapidement le développement.
Procédure d'utilisation détaillée
- Affiner le modèleLes informations sur la sélection d'un modèle, le téléchargement des données, la configuration des paramètres et le lancement de la mise au point sont détaillées.
- Génération de données synthétiquesLes outils de visualisation : des détails sur la façon de créer et d'éditer des données à l'aide d'outils de visualisation.
- Travail d'équipeLe site web de l'Agence européenne pour la sécurité des réseaux et de l'information (ESA) : Une description détaillée de la manière d'utiliser le contrôle de version Git pour gérer les ensembles de données et de la manière de fournir et de traiter le retour d'information.
- Génération de conseilsLes informations sur la sélection d'un type d'invite, le téléchargement de données et la génération d'une invite sont expliquées en détail.
- Intégration dans le flux de travailLe site Web de Python : Il explique comment utiliser les bibliothèques et les API de Python pour l'intégration, en fournissant des exemples de code et des scénarios d'utilisation.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...