Kiln: Einfache LLM-Modell-Feinabstimmung und Datensynthesewerkzeuge, 0 Codebasis zur Feinabstimmung ihrer eigenen kleinen Modelle

🚀 Einladung zum Erleben: Chinas erste KI-IDE Intelligente Programmiersoftware Trae Chinesische Version downloadDer DeepSeek-R1 und Doubao-pro sind unbegrenzt verfügbar!

Allgemeine Einführung

Kiln ist ein Open-Source-Tool, das sich auf die Feinabstimmung von Large Language Models (LLMs), die Erzeugung synthetischer Daten und die Zusammenarbeit von Datensätzen konzentriert. Es bietet eine intuitive Desktop-Anwendung mit Unterstützung für Windows-, MacOS- und Linux-Systeme, mit der Benutzer Modelle wie Llama, GPT4o und Mixtral ohne Code feinabstimmen und serverlose Einsätze automatisieren können.Kiln unterstützt auch die Erzeugung von Trainingsdaten durch ein interaktives Visualisierungstool, das eine Git-basierte Versionskontrolle für eine einfache Teamarbeit bietet. Kiln unterstützt auch die Generierung von Trainingsdaten durch interaktive Visualisierungstools und bietet eine Git-basierte Versionskontrolle für die Teamzusammenarbeit bei strukturierten Daten. Seine offene Python-Bibliothek und OpenAPI REST API machen es Entwicklern leicht, Kiln-Datensätze in ihre Arbeitsabläufe zu integrieren.

Kiln: Einfaches LLM-Modell-Feinabstimmung und Datensynthesewerkzeug, 0 Codebasis zur Feinabstimmung Ihres eigenen kleinen Modells -1

Kiln: ein einfaches LLM-Modell für die Feinabstimmung und Datensynthese-1

Funktionsliste

Intuitive Desktop-AnwendungUnterstützt Windows-, MacOS- und Linux-Systeme mit Ein-Klick-Installation und intuitivem Design.
Null-Code-FeinabstimmungUnterstützt die Feinabstimmung von Modellen wie Llama, GPT4o und Mixtral mit automatischer serverloser Bereitstellung.
Erzeugung synthetischer DatenGenerierung von Trainingsdaten durch interaktive Visualisierungstools.
TeamarbeitGit-basierte Versionskontrolle für Teammitglieder zur gemeinsamen Arbeit an Datensätzen.
Tipp-ErzeugungAutomatische Generierung von Prompts aus den Daten, einschließlich Chainthink, Under-Sampling und Multi-Sample Prompts.
Umfassende Unterstützung für Modelle und AnbieterUnterstützung für Ollama, OpenAI, OpenRouter, Fireworks, Groq, AWS und mehr.
Quelloffene Bibliotheken und APIsStellt die quelloffene MIT-Python-Bibliothek und die OpenAPI REST API zur Verfügung.
Privatsphäre geht vorBenutzerdaten sind vollständig privat, mit Unterstützung für lokalen Betrieb und eigenständige API-Schlüssel.
Unterstützung für strukturierte DatenJSON-fähige KI-Aufgaben erstellen.
Kostenlose NutzungDesktop-Anwendungen sind kostenlos und Open-Source-Bibliotheken sind offen.

Hilfe verwenden

Ablauf der Installation

Download der BewerbungBesuchen Sie die Kiln GitHub-Seite und wählen Sie den entsprechenden Download für Ihr Betriebssystem.
Installation von Anwendungen::
- Windows (Computer)Führen Sie die heruntergeladene .exe-Datei aus und folgen Sie den Anweisungen des Installationsassistenten, um die Installation abzuschließen.
- MacOSLaden Sie die .dmg-Datei herunter, öffnen Sie sie und ziehen Sie Kiln in den Anwendungsordner.
- LinuxLaden Sie die .tar.gz-Datei herunter, entpacken Sie sie und führen Sie das Installationsskript aus.

Richtlinien für die Verwendung

Starten Sie die AnwendungSobald die Installation abgeschlossen ist, öffnen Sie die Desktop-Anwendung Kiln.
Feinabstimmung des Modells::
- Wählen Sie das Funktionsmodul "Feinabstimmung".
- Wählen Sie das Modell für die Feinabstimmung aus (z. B. Llama, GPT4o, Mixtral).
- Laden Sie Trainingsdaten hoch oder erstellen Sie einen Datensatz mit dem Kiln-Tool zur Erzeugung synthetischer Daten.
- Konfigurieren Sie die Feinabstimmungsparameter und klicken Sie auf "Feinabstimmung starten".
- Sobald die Feinabstimmung abgeschlossen ist, wird das Modell automatisch eingesetzt, ohne dass weitere Maßnahmen erforderlich sind.
Synthetische Daten generieren::
- Wählen Sie das Funktionsmodul "Synthetische Datenerzeugung".
- Erstellen und bearbeiten Sie Trainingsdaten mit interaktiven Visualisierungstools.
- Speichern Sie den generierten Datensatz für eine spätere Feinabstimmung.
Teamarbeit::
- Wählen Sie das Funktionsmodul Dataset Collaboration.
- Verwenden Sie die Git-Versionskontrolle, um Datensätze zu verwalten und die Zusammenarbeit von Teammitgliedern zu erleichtern.
- Stellen Sie Beispiele, Tipps, Feedback und andere Informationen über den Datensatz zur Verfügung, um den Teammitgliedern die gemeinsame Arbeit daran zu erleichtern.
Tipp-Erzeugung::
- Wählen Sie den Funktionsbaustein Promptgenerierung.
- Laden Sie den Datensatz hoch und wählen Sie die Art der Aufforderung aus (z. B. Kettendenken, weniger Proben, mehrere Proben).
- Automatische Generierung von Hinweisen für Modelltraining und Inferenz.
Integration in den Arbeitsablauf::
- Integrieren Sie die Datensätze und Funktionen von Kiln in Ihre eigenen Arbeitsabläufe, indem Sie die Python-Bibliothek von Kiln und die OpenAPI REST API verwenden.
- Lesen Sie die Dokumentation und den Beispielcode von Kiln, um schnell mit der Entwicklung zu beginnen.

Detaillierte Vorgehensweise

Feinabstimmung des ModellsDetails zur Auswahl eines Modells, zum Hochladen von Daten, zur Konfiguration von Parametern und zur Einleitung der Feinabstimmung.
Erzeugung synthetischer DatenDetails zur Erstellung und Bearbeitung von Daten mit Hilfe von Visualisierungswerkzeugen.
TeamarbeitEine detaillierte Beschreibung der Verwendung der Git-Versionskontrolle zur Verwaltung von Datensätzen und zur Bereitstellung und Verarbeitung von Feedback.
Tipp-ErzeugungDetails zur Auswahl eines Prompt-Typs, zum Hochladen von Daten und zur Erstellung eines Prompts.
Integration in den ArbeitsablaufDetails zur Verwendung von Python-Bibliotheken und APIs für die Integration, mit Beispielcode und Anwendungsszenarien.