Allgemeine Einführung
LaWGPT ist ein Open-Source-Projekt, das von der Forschungsgruppe für maschinelles Lernen und Data Mining der Universität Nanjing unterstützt wird und sich dem Aufbau eines großen Sprachmodells auf der Grundlage von chinesischem Rechtswissen widmet. Es erweitert proprietäre Wortlisten im juristischen Bereich auf der Grundlage generischer chinesischer Modelle (z. B. Chinese-LLaMA und ChatGLM) und verbessert das semantische Verständnis und die Dialogfähigkeiten des Modells in juristischen Szenarien durch umfangreiches Vortraining des juristischen Korpus und Feinabstimmung der Befehle im juristischen Q&A-Datensatz erheblich. Das Projekt wird von mehreren Mitarbeitern gefördert und ist auf Szenarien wie den juristischen Dialog und das Training für juristische Prüfungen anwendbar. Obwohl das Modell noch durch Daten und Kapazitäten begrenzt ist und die Ergebnisse unsicher sein können, machen sein Open-Source-Charakter und die Unterstützung der Gemeinschaft es zu einer wichtigen Ressource für die KI-Forschung im Rechtsbereich.
Funktionsliste
- Rechtliche Q&A GenerationGenerierung präziser Antworten auf der Grundlage eingegebener rechtlicher Fragen, die für die Beratung und das Lernen geeignet sind.
- Ausbildung für die richterliche PrüfungBietet Q&A-Training auf der Grundlage des China Judicial Exam Datensatzes, um den Benutzern bei der Vorbereitung auf die Prüfung zu helfen.
- Rechtskorpus-VerständnisVorbildung, um den Inhalt komplexer Rechtsinstrumente und Satzungen analysieren zu können.
- Befehlszeilen-Batch-ReasoningUnterstützung für Entwickler bei der Stapelverarbeitung von Gesetzesdaten durch Skripte.
- Dialog im interaktiven ModusInteraktives Beantworten von Benutzerfragen in Echtzeit, wenn keine vordefinierten Daten verfügbar sind.
- Unterstützung der ModellgewichtungLoRA-Gewichte werden zur Verfügung gestellt, damit der Benutzer individuelle Anpassungen in Verbindung mit dem Originalmodell vornehmen kann.
Hilfe verwenden
Ablauf der Installation
LaWGPT ist ein GitHub-basiertes Open-Source-Projekt. Sie müssen die Umgebung und die Abhängigkeiten vor der Verwendung installieren. Im Folgenden finden Sie die detaillierten Installationsschritte:
- Projektcode klonen
Öffnen Sie ein Terminal und geben Sie den folgenden Befehl ein, um den Code lokal herunterzuladen:
git clone git@github.com:pengxiao-song/LaWGPT.git
cd LaWGPT
Dadurch wird die LaWGPT-Codebasis auf Ihren Computer geklont und in das Projektverzeichnis verschoben.
- Erstellen einer virtuellen Umgebung
Verwenden Sie Conda, um eine separate Python-Umgebung zu erstellen und Abhängigkeitskonflikte zu vermeiden:
conda create -n lawgpt python=3.10 -y
conda activate lawgpt
Nach der Aktivierung der Umgebung werden die folgenden Operationen auf dem lawgpt
das Umfeld, in dem sie durchgeführt wird.
- Installation von Abhängigkeiten
Das Projekt bietetAnforderungen.txt
die die erforderlichen Bibliotheken auflistet. Führen Sie den folgenden Befehl aus, um sie zu installieren:
pip install -r anforderungen.txt
Zu den Abhängigkeiten gehören Transformatoren
, undpeft
, undgradio
usw., um sicherzustellen, dass das Netz frei ist, um den Download abzuschließen.
- Modellgewichte erhalten
Da LLaMA und Chinese-LLaMA die vollständigen Gewichte nicht als Open Source zur Verfügung stellen, bietet LaWGPT nur LoRA-Gewichte. Sie benötigen:
- Holen Sie sich die Gewichte für chinesische LaMA- oder andere Basismodelle aus offiziellen Quellen.
- Führen Sie die LoRA-Gewichte mit dem Basismodell zusammen (Einzelheiten dazu finden Sie in der Projektdokumentation).
- Überprüfen der Installation
Führen Sie das Beispielskript aus, um sicherzustellen, dass die Umgebung korrekt ist:
bash-skripte/infer.sh
Wenn Sie erfolgreich in den interaktiven Modus wechseln, ist die Installation abgeschlossen.
Verwendung
Hauptfunktionsbereiche: Juristisches Quiz und Argumentation
- interaktiver Modus
Wenn der Testdatenpfad nicht angegeben ist, führen Sie diebash-skripte/infer.sh
Es wird in den interaktiven Modus geschaltet. Sie können z. B. direkt rechtliche Fragen eingeben:
Bitte erläutern Sie den Inhalt von Artikel 10 des Vertragsgesetzes der Volksrepublik China.
Das Modell generiert Antworten in Echtzeit und eignet sich für eine schnelle Beratung oder zum Lernen.
- kritische Schlussfolgerung
Um mehrere Ausgaben zu bearbeiten, bereiten Sie eine JSON-Datei vor (Formatreferenz)resources/example_instruction_train.json
), zum Beispiel:
{"instruction": "Wie wird das Vermögen nach einer Scheidung aufgeteilt?" , "output": ""}
Übergeben Sie den Dateipfad an das Skript:
bash scripts/infer.sh --infer_data_path . /test.json
Das Modell verarbeitet die Ergebnisse zeilenweise und gibt sie aus. Die Ergebnisse können für spätere Analysen gespeichert werden.
Featured Operation: Training für die juristische Prüfung
- Vorbereiten des Datensatzes
LaWGPT unterstützt das Training auf der Grundlage des Justizprüfungsdatensatzes. Sie können sich beziehen aufTolle chinesische juristische Ressourcen
Laden Sie den öffentlich zugänglichen Datensatz herunter, oder erstellen Sie Ihre eigenen Frage- und Antwortpaare im folgenden Format:{"instruction": "Welches der folgenden Elemente ist kein Bestandteil eines Verbrechens?" , "output": "A. Gegenstand der Straftat B. Ziel der Straftat C. Motiv für die Straftat D. Objektive Aspekte der Straftat"}
Speichern als JSON-Datei, z. B.
exam_data.json
. - Lauftraining
ausnutzenfinetune.py
Skripte für die Feinabstimmung der Befehle:python finetune.py --data_path . /exam_data.json ---base_model --lora_weights
Parameter Beschreibung:
--daten_pfad
Pfad des Datensatzes.---basismodell
Wege des Basismodells.--Lora_Gewichte
: LoRA-Gewichtspfad.
Sobald die Schulung abgeschlossen ist, wird das Modell besser an juristische Prüfungsfragen angepasst werden können.
Nutzung der Webschnittstelle
- Starten der WebUI
Die Projektunterstützung bietet eine grafische Schnittstelle über Gradio. Läuft:bash-skripte/webui.sh
Beim Start öffnet der Browser eine lokale Seite (normalerweise die
http://127.0.0.1:7860
). - Arbeitsablauf
- Geben Sie eine rechtliche Frage in das Eingabefeld ein, z. B. "Wie melde ich ein Patent an?".
- Klicken Sie auf "Absenden" und warten Sie, bis das Modell eine Antwort generiert hat.
- Zeigen Sie die Ausgabe an, die kopiert oder gespeichert werden kann.
Die Weboberfläche ist auch für technisch nicht versierte Benutzer geeignet und intuitiv zu bedienen.
caveat
- Hardware-VoraussetzungEs wird empfohlen, einen Grafikprozessor (z. B. Tesla V100) zu verwenden, um die Inferenz zu beschleunigen, da der CPU-Betrieb langsamer sein kann.
- ModellauswahlDie Standardeinstellung ist die Verwendung von
LaWGPT-7B-alpha
Wenn Sie Folgendes benötigenbeta 1.0
vielleichtbeta 1.1
Die Modellparameter im Skript müssen angepasst werden. - EinschränkungenModelle können aufgrund von Datenbeschränkungen ungenaue Inhalte generieren, und die Ergebnisse müssen bei ihrer Verwendung, insbesondere in realen rechtlichen Szenarien, validiert werden.
Mit diesen Schritten können Sie einfach mit LaWGPT beginnen und erhalten effiziente Unterstützung, egal ob Sie juristische Quizze durchführen oder sich auf juristische Prüfungen vorbereiten.