Allgemeine Einführung
SFT-data-builder ist ein Open-Source-Projekt zur Erzeugung hochwertiger SFT-Trainingsdaten durch die Kombination von privaten Domaindaten des Benutzers mit der kostenlosen Big Model API. Das Tool unterstützt eine Vielzahl von KI-Modellformaten und bietet Funktionen für die Ein-Klick-Generierung, die Batch-Generierung, die flexible Bearbeitung und die lokale Speicherung, um den Benutzern bei der schnellen Generierung von Trainingsdaten zu helfen, die für Pre-Training, Feinabstimmung, Funktionsaufrufe und andere Szenarien geeignet sind.
Funktionsliste
- Generieren Sie Trainingsdaten mit einem KlickZahlreiche OpenAI-Formataufrufe für lokale oder cloudbasierte Modelle werden unterstützt.
- StapelverarbeitungGenerierung von Trainingsdaten aus mehreren verschiedenen Perspektiven auf einmal, Unterstützung von Batch-URL-Artikeln zur automatischen Datengenerierung.
- Flexible BearbeitungAlle generierten Daten können jederzeit bearbeitet und angepasst werden.
- lokaler SpeicherAutomatisch alle Daten lokal speichern.
- Leicht zu exportierenExportieren Sie JSON-Dateien im Standardformat mit einem Klick.
- Unterstützung mehrerer ModelleUnterstützt eine breite Palette von Mainstream-KI-Modellen, mit anpassbaren Modellen.
- Unterstützung mehrerer FormateUnterstützung für PDF, Word, TXT und andere Dateiformate.
Hilfe verwenden
Ablauf der Installation
- Installation von AbhängigkeitenAusführen im Projektverzeichnis
npm-Installation
. - Initiierung von Projekten: Lauf
npm run start
Lancierung des Projekts.
Richtlinien für die Verwendung
- Konfigurieren der API::
- Klicken Sie auf die Schaltfläche "Konfiguration öffnen".
- Legen Sie die API-Adresse und den Schlüssel fest.
- Wählen Sie das AI-Modell aus oder passen Sie es an.
- Legt die Anzahl der gleichzeitig erzeugten Dateneinträge fest.
- Eingabe::
- Hochladen von Dateien (PDF, DOCX, TXT unterstützt).
- oder geben Sie den Textinhalt direkt ein.
- Daten generieren::
- Klicken Sie auf die Schaltfläche AI-Antwort generieren.
- Schalten Sie durch mehrere generierte Ergebnisse und bearbeiten Sie den generierten Inhalt nach Bedarf.
- Verwaltungsdaten::
- Zur Datenliste hinzufügen.
- Vorschau aller generierten Daten.
- Löschen Sie unerwünschte Daten.
- Export als JSON-Datei.
Funktion Betriebsablauf
- Generieren Sie Trainingsdaten mit einem Klick::
- Wählen Sie das AI-Modell aus oder passen Sie es an.
- Textinhalt eingeben oder hochladen.
- Klicken Sie auf die Schaltfläche "KI-Antwort generieren". Das System generiert automatisch Trainingsdaten.
- Stapelverarbeitung::
- Legen Sie die Parameter für die Stapelgenerierung auf der Konfigurationsseite fest.
- Laden Sie eine Datei mit mehreren URLs hoch oder geben Sie mehrere URLs ein.
- Klicken Sie auf die Schaltfläche "Batch Generate", das System wird automatisch mehrere Trainingsdaten generieren.
- Flexible Bearbeitung::
- Klicken Sie auf dem Bildschirm "Generierte Ergebnisse" auf den zu bearbeitenden Dateneintrag.
- Ändern Sie den Inhalt im Editor, um die Änderungen zu speichern.
- Lokale Speicherung und Export::
- Alle generierten Daten werden automatisch im lokalen Speicher abgelegt.
- Wählen Sie auf dem Datenverwaltungsbildschirm die zu exportierenden Daten aus und klicken Sie auf die Schaltfläche "Export to JSON".