Allgemeine Einführung
Kiln ist ein Open-Source-Tool, das sich auf die Feinabstimmung von Large Language Models (LLMs), die Erzeugung synthetischer Daten und die Zusammenarbeit von Datensätzen konzentriert. Es bietet eine intuitive Desktop-Anwendung mit Unterstützung für Windows-, MacOS- und Linux-Systeme, mit der Benutzer Modelle wie Llama, GPT4o und Mixtral ohne Code feinabstimmen und serverlose Einsätze automatisieren können.Kiln unterstützt auch die Erzeugung von Trainingsdaten durch ein interaktives Visualisierungstool, das eine Git-basierte Versionskontrolle für eine einfache Teamarbeit bietet. Kiln unterstützt auch die Generierung von Trainingsdaten durch interaktive Visualisierungstools und bietet eine Git-basierte Versionskontrolle für die Teamzusammenarbeit bei strukturierten Daten. Seine offene Python-Bibliothek und OpenAPI REST API machen es Entwicklern leicht, Kiln-Datensätze in ihre Arbeitsabläufe zu integrieren.
Funktionsliste
- Intuitive Desktop-AnwendungUnterstützt Windows-, MacOS- und Linux-Systeme mit Ein-Klick-Installation und intuitivem Design.
- Null-Code-FeinabstimmungUnterstützt die Feinabstimmung von Modellen wie Llama, GPT4o und Mixtral mit automatischer serverloser Bereitstellung.
- Erzeugung synthetischer DatenGenerierung von Trainingsdaten durch interaktive Visualisierungstools.
- TeamarbeitGit-basierte Versionskontrolle für Teammitglieder zur gemeinsamen Arbeit an Datensätzen.
- Tipp-ErzeugungAutomatische Generierung von Prompts aus den Daten, einschließlich Chainthink, Under-Sampling und Multi-Sample Prompts.
- Umfassende Unterstützung für Modelle und AnbieterUnterstützung für Ollama, OpenAI, OpenRouter, Fireworks, Groq, AWS und mehr.
- Quelloffene Bibliotheken und APIsStellt die quelloffene MIT-Python-Bibliothek und die OpenAPI REST API zur Verfügung.
- Privatsphäre geht vorBenutzerdaten sind vollständig privat, mit Unterstützung für lokalen Betrieb und eigenständige API-Schlüssel.
- Unterstützung für strukturierte DatenJSON-fähige KI-Aufgaben erstellen.
- Kostenlose NutzungDesktop-Anwendungen sind kostenlos und Open-Source-Bibliotheken sind offen.
Hilfe verwenden
Ablauf der Installation
- Download der BewerbungBesuchen Sie die Kiln GitHub-Seite und wählen Sie den entsprechenden Download für Ihr Betriebssystem.
- Installation von Anwendungen::
- Windows (Computer)Führen Sie die heruntergeladene .exe-Datei aus und folgen Sie den Anweisungen des Installationsassistenten, um die Installation abzuschließen.
- MacOSLaden Sie die .dmg-Datei herunter, öffnen Sie sie und ziehen Sie Kiln in den Anwendungsordner.
- LinuxLaden Sie die .tar.gz-Datei herunter, entpacken Sie sie und führen Sie das Installationsskript aus.
Richtlinien für die Verwendung
- Starten Sie die AnwendungSobald die Installation abgeschlossen ist, öffnen Sie die Desktop-Anwendung Kiln.
- Feinabstimmung des Modells::
- Wählen Sie das Funktionsmodul "Feinabstimmung".
- Wählen Sie das Modell für die Feinabstimmung aus (z. B. Llama, GPT4o, Mixtral).
- Laden Sie Trainingsdaten hoch oder erstellen Sie einen Datensatz mit dem Kiln-Tool zur Erzeugung synthetischer Daten.
- Konfigurieren Sie die Feinabstimmungsparameter und klicken Sie auf "Feinabstimmung starten".
- Sobald die Feinabstimmung abgeschlossen ist, wird das Modell automatisch eingesetzt, ohne dass weitere Maßnahmen erforderlich sind.
- Synthetische Daten generieren::
- Wählen Sie das Funktionsmodul "Synthetische Datenerzeugung".
- Erstellen und bearbeiten Sie Trainingsdaten mit interaktiven Visualisierungstools.
- Speichern Sie den generierten Datensatz für eine spätere Feinabstimmung.
- Teamarbeit::
- Wählen Sie das Funktionsmodul Dataset Collaboration.
- Verwenden Sie die Git-Versionskontrolle, um Datensätze zu verwalten und die Zusammenarbeit von Teammitgliedern zu erleichtern.
- Stellen Sie Beispiele, Tipps, Feedback und andere Informationen über den Datensatz zur Verfügung, um den Teammitgliedern die gemeinsame Arbeit daran zu erleichtern.
- Tipp-Erzeugung::
- Wählen Sie den Funktionsbaustein Promptgenerierung.
- Laden Sie den Datensatz hoch und wählen Sie die Art der Aufforderung aus (z. B. Kettendenken, weniger Proben, mehrere Proben).
- Automatische Generierung von Hinweisen für Modelltraining und Inferenz.
- Integration in den Arbeitsablauf::
- Integrieren Sie die Datensätze und Funktionen von Kiln in Ihre eigenen Arbeitsabläufe, indem Sie die Python-Bibliothek von Kiln und die OpenAPI REST API verwenden.
- Lesen Sie die Dokumentation und den Beispielcode von Kiln, um schnell mit der Entwicklung zu beginnen.
Detaillierte Vorgehensweise
- Feinabstimmung des ModellsDetails zur Auswahl eines Modells, zum Hochladen von Daten, zur Konfiguration von Parametern und zur Einleitung der Feinabstimmung.
- Erzeugung synthetischer DatenDetails zur Erstellung und Bearbeitung von Daten mit Hilfe von Visualisierungswerkzeugen.
- TeamarbeitEine detaillierte Beschreibung der Verwendung der Git-Versionskontrolle zur Verwaltung von Datensätzen und zur Bereitstellung und Verarbeitung von Feedback.
- Tipp-ErzeugungDetails zur Auswahl eines Prompt-Typs, zum Hochladen von Daten und zur Erstellung eines Prompts.
- Integration in den ArbeitsablaufDetails zur Verwendung von Python-Bibliotheken und APIs für die Integration, mit Beispielcode und Anwendungsszenarien.