AI Personal Learning
und praktische Anleitung
豆包Marscode1

Kiln: Einfaches LLM-Modell-Feinabstimmung und Datensynthesewerkzeug, 0-Code-Basis zur Feinabstimmung Ihrer eigenen Mini-Modelle!

Allgemeine Einführung

Kiln ist ein Open-Source-Tool, das sich auf die Feinabstimmung von Large Language Models (LLMs), die Erzeugung synthetischer Daten und die Zusammenarbeit von Datensätzen konzentriert. Es bietet eine intuitive Desktop-Anwendung mit Unterstützung für Windows-, MacOS- und Linux-Systeme, mit der Benutzer Modelle wie Llama, GPT4o und Mixtral ohne Code feinabstimmen und serverlose Einsätze automatisieren können.Kiln unterstützt auch die Erzeugung von Trainingsdaten durch ein interaktives Visualisierungstool, das eine Git-basierte Versionskontrolle für eine einfache Teamarbeit bietet. Kiln unterstützt auch die Generierung von Trainingsdaten durch interaktive Visualisierungstools und bietet eine Git-basierte Versionskontrolle für die Teamzusammenarbeit bei strukturierten Daten. Seine offene Python-Bibliothek und OpenAPI REST API machen es Entwicklern leicht, Kiln-Datensätze in ihre Arbeitsabläufe zu integrieren.

Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型-1


 

Kiln:简单的LLM模型微调和数据合成工具-1

 

Funktionsliste

  • Intuitive Desktop-AnwendungUnterstützt Windows-, MacOS- und Linux-Systeme mit Ein-Klick-Installation und intuitivem Design.
  • Null-Code-FeinabstimmungUnterstützt die Feinabstimmung von Modellen wie Llama, GPT4o und Mixtral mit automatischer serverloser Bereitstellung.
  • Erzeugung synthetischer DatenGenerierung von Trainingsdaten durch interaktive Visualisierungstools.
  • TeamarbeitGit-basierte Versionskontrolle für Teammitglieder zur gemeinsamen Arbeit an Datensätzen.
  • Tipp-ErzeugungAutomatische Generierung von Prompts aus den Daten, einschließlich Chainthink, Under-Sampling und Multi-Sample Prompts.
  • Umfassende Unterstützung für Modelle und AnbieterUnterstützung für Ollama, OpenAI, OpenRouter, Fireworks, Groq, AWS und mehr.
  • Quelloffene Bibliotheken und APIsStellt die quelloffene MIT-Python-Bibliothek und die OpenAPI REST API zur Verfügung.
  • Privatsphäre geht vorBenutzerdaten sind vollständig privat, mit Unterstützung für lokalen Betrieb und eigenständige API-Schlüssel.
  • Unterstützung für strukturierte DatenJSON-fähige KI-Aufgaben erstellen.
  • Kostenlose NutzungDesktop-Anwendungen sind kostenlos und Open-Source-Bibliotheken sind offen.

 

Hilfe verwenden

Einbauverfahren

  1. Download der BewerbungBesuchen Sie die Kiln GitHub-Seite und wählen Sie den entsprechenden Download für Ihr Betriebssystem.
  2. Installation von Anwendungen::
    • Windows (Computer)Führen Sie die heruntergeladene .exe-Datei aus und folgen Sie den Anweisungen des Installationsassistenten, um die Installation abzuschließen.
    • MacOSLaden Sie die .dmg-Datei herunter, öffnen Sie sie und ziehen Sie Kiln in den Anwendungsordner.
    • LinuxLaden Sie die .tar.gz-Datei herunter, entpacken Sie sie und führen Sie das Installationsskript aus.

Leitlinien für die Verwendung

  1. Starten Sie die AnwendungSobald die Installation abgeschlossen ist, öffnen Sie die Desktop-Anwendung Kiln.
  2. Feinabstimmung des Modells::
    • Wählen Sie das Funktionsmodul "Feineinstellung".
    • Wählen Sie das Modell für die Feinabstimmung aus (z. B. Llama, GPT4o, Mixtral).
    • Laden Sie Trainingsdaten hoch oder erstellen Sie einen Datensatz mit dem Kiln-Tool zur Erzeugung synthetischer Daten.
    • Konfigurieren Sie die Feinabstimmungsparameter und klicken Sie auf "Feinabstimmung starten".
    • Sobald die Feinabstimmung abgeschlossen ist, wird das Modell automatisch eingesetzt, ohne dass weitere Maßnahmen erforderlich sind.
  3. Synthetische Daten generieren::
    • Wählen Sie das Funktionsmodul "Synthetische Datenerzeugung".
    • Erstellen und bearbeiten Sie Trainingsdaten mit interaktiven Visualisierungstools.
    • Speichern Sie den generierten Datensatz für eine spätere Feinabstimmung.
  4. Teamarbeit::
    • Wählen Sie das Funktionsmodul Dataset Collaboration.
    • Verwenden Sie die Git-Versionskontrolle, um Datensätze zu verwalten und die Zusammenarbeit von Teammitgliedern zu erleichtern.
    • Stellen Sie Beispiele, Tipps, Feedback und andere Informationen über den Datensatz zur Verfügung, um den Teammitgliedern die gemeinsame Arbeit daran zu erleichtern.
  5. Tipp-Erzeugung::
    • Wählen Sie den Funktionsbaustein Prompt Generation.
    • Laden Sie den Datensatz hoch und wählen Sie die Art der Aufforderung aus (z. B. Kettendenken, weniger Proben, mehrere Proben).
    • Automatische Generierung von Hinweisen für Modelltraining und Inferenz.
  6. Integration in den Arbeitsablauf::
    • Integrieren Sie die Datensätze und Funktionen von Kiln in Ihre eigenen Arbeitsabläufe, indem Sie die Python-Bibliothek von Kiln und die OpenAPI REST API verwenden.
    • Lesen Sie die Dokumentation und den Beispielcode von Kiln, um schnell mit der Entwicklung zu beginnen.

Detaillierte Vorgehensweise

  • Feinabstimmung des ModellsDetails zur Auswahl eines Modells, zum Hochladen von Daten, zur Konfiguration von Parametern und zum Start der Feinabstimmung.
  • Erzeugung synthetischer DatenDetails zur Erstellung und Bearbeitung von Daten mit Hilfe von Visualisierungswerkzeugen.
  • TeamarbeitEine detaillierte Beschreibung der Verwendung der Git-Versionskontrolle zur Verwaltung von Datensätzen und zur Bereitstellung und Verarbeitung von Feedback.
  • Tipp-ErzeugungDetails zur Auswahl eines Prompt-Typs, zum Hochladen von Daten und zur Erstellung eines Prompts.
  • Integration in den ArbeitsablaufDetails zur Verwendung von Python-Bibliotheken und APIs für die Integration, mit Beispielcode und Anwendungsszenarien.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Kiln: Einfaches LLM-Modell-Feinabstimmung und Datensynthesewerkzeug, 0-Code-Basis zur Feinabstimmung Ihrer eigenen Mini-Modelle!
de_DEDeutsch