Allgemeine Einführung
LaWGPT ist ein Open-Source-Projekt, das von der Forschungsgruppe für maschinelles Lernen und Data Mining der Universität Nanjing unterstützt wird und sich dem Aufbau eines großen Sprachmodells auf der Grundlage von chinesischem Rechtswissen widmet. Es erweitert proprietäre Wortlisten im juristischen Bereich auf der Grundlage generischer chinesischer Modelle (z. B. Chinese-LLaMA und ChatGLM) und verbessert das semantische Verständnis und die Dialogfähigkeit des Modells in juristischen Szenarien durch umfangreiches Vortraining des juristischen Korpus und Feinabstimmung der Befehle im juristischen Q&A-Datensatz erheblich. Das Projekt wird von mehreren Mitarbeitern gefördert und ist auf Szenarien wie den juristischen Dialog und das Training für juristische Prüfungen anwendbar. Obwohl das Modell noch durch Daten und Kapazitäten begrenzt ist und die Ergebnisse unsicher sein können, machen sein Open-Source-Charakter und die Unterstützung der Gemeinschaft es zu einer wichtigen Ressource für die KI-Forschung im Rechtsbereich.
Funktionsliste
- Rechtliche Q&A GenerationGenerierung präziser Antworten auf der Grundlage eingegebener rechtlicher Fragen, die für die Beratung und das Lernen geeignet sind.
- Ausbildung für die richterliche PrüfungBietet Q&A-Training auf der Grundlage des China Judicial Exam Datensatzes, um den Benutzern bei der Vorbereitung auf die Prüfung zu helfen.
- Rechtskorpus-VerständnisVorbildung, um den Inhalt komplexer Rechtsinstrumente und Satzungen analysieren zu können.
- Befehlszeilen-Batch-ReasoningUnterstützung von Entwicklern bei der Stapelverarbeitung von juristischen Daten durch Skripte.
- Dialog im interaktiven ModusInteraktives Beantworten von Benutzerfragen in Echtzeit, wenn keine vordefinierten Daten verfügbar sind.
- Unterstützung der ModellgewichtungLoRA-Gewichte werden zur Verfügung gestellt, damit der Benutzer individuelle Anpassungen in Verbindung mit dem Originalmodell vornehmen kann.
Hilfe verwenden
Einbauverfahren
LaWGPT ist ein GitHub-basiertes Open-Source-Projekt. Sie müssen die Umgebung und die Abhängigkeiten vor der Verwendung installieren. Im Folgenden finden Sie die detaillierten Installationsschritte:
- Projektcode klonen
Öffnen Sie ein Terminal und geben Sie den folgenden Befehl ein, um den Code lokal herunterzuladen:
git clone git@github.com:pengxiao-song/LaWGPT.git
cd LaWGPT
Dadurch wird die LaWGPT-Codebasis auf Ihren Computer geklont und in das Projektverzeichnis verschoben.
- Erstellen einer virtuellen Umgebung
Verwenden Sie Conda, um eine separate Python-Umgebung zu erstellen und Abhängigkeitskonflikte zu vermeiden:
conda create -n lawgpt python=3.10 -y
conda activate lawgpt
Nach der Aktivierung der Umgebung werden die folgenden Operationen auf dem lawgpt
das Umfeld, in dem sie durchgeführt wird.
- Installation von Abhängigkeiten
Das Projekt bietetrequirements.txt
die die erforderlichen Bibliotheken auflistet. Führen Sie den folgenden Befehl aus, um sie zu installieren:
pip install -r requirements.txt
Zu den Abhängigkeiten gehören transformers
undpeft
undgradio
usw., um sicherzustellen, dass das Netz frei ist, um den Download abzuschließen.
- Modellgewichte erhalten
Da LLaMA und Chinese-LLaMA die vollständigen Gewichte nicht als Open Source zur Verfügung stellen, bietet LaWGPT nur LoRA-Gewichte. Sie benötigen:
- Holen Sie sich die Gewichte für chinesische LaMA- oder andere Basismodelle aus offiziellen Quellen.
- Führen Sie die LoRA-Gewichte mit dem Basismodell zusammen (Einzelheiten dazu finden Sie in der Projektdokumentation).
- Überprüfen der Installation
Führen Sie das Beispielskript aus, um sicherzustellen, dass die Umgebung korrekt ist:
bash scripts/infer.sh
Wenn Sie erfolgreich in den interaktiven Modus wechseln, ist die Installation abgeschlossen.
Verwendung
Hauptfunktionsbereiche: Juristisches Quiz und Argumentation
- interaktiver Modus
Wenn der Testdatenpfad nicht angegeben ist, führen Sie diebash scripts/infer.sh
Es wird in den interaktiven Modus geschaltet. Sie können z. B. direkt rechtliche Fragen eingeben:
请解释《中华人民共和国合同法》第十条的内容。
Das Modell generiert Antworten in Echtzeit und eignet sich für eine schnelle Beratung oder zum Lernen.
- kritische Schlussfolgerung
Wenn Sie mehrere Ausgaben bearbeiten müssen, bereiten Sie eine JSON-Datei vor (Formatreferenz)resources/example_instruction_train.json
), zum Beispiel:
{"instruction": "离婚后财产如何分割?", "output": ""}
Übergeben Sie den Dateipfad an das Skript:
bash scripts/infer.sh --infer_data_path ./test.json
Das Modell verarbeitet die Ergebnisse zeilenweise und gibt sie aus. Die Ergebnisse können für spätere Analysen gespeichert werden.
Featured Operation: Training für die juristische Prüfung
- Vorbereiten des Datensatzes
LaWGPT unterstützt das Training auf der Grundlage des Justizprüfungsdatensatzes. Sie können sich beziehen aufAwesome Chinese Legal Resources
Laden Sie den öffentlich zugänglichen Datensatz herunter, oder erstellen Sie Ihre eigenen Frage- und Antwortpaare im folgenden Format:{"instruction": "下列哪项不属于犯罪构成要件?", "output": "A. 犯罪主体 B. 犯罪客体 C. 犯罪动机 D. 犯罪客观方面"}
Speichern als JSON-Datei, z. B.
exam_data.json
. - Lauftraining
ausnutzenfinetune.py
Skripte für die Feinabstimmung der Befehle:python finetune.py --data_path ./exam_data.json --base_model <path_to_base_model> --lora_weights <path_to_lora>
Parameter Beschreibung:
--data_path
Pfad des Datensatzes.--base_model
Wege des Basismodells.--lora_weights
: LoRA-Gewichtspfad.
Sobald die Schulung abgeschlossen ist, wird das Modell besser an juristische Prüfungsfragen angepasst werden können.
Nutzung der Webschnittstelle
- Starten der WebUI
Die Projektunterstützung bietet eine grafische Schnittstelle über Gradio. Läuft:bash scripts/webui.sh
Beim Start öffnet der Browser eine lokale Seite (normalerweise die
http://127.0.0.1:7860
). - Arbeitsablauf
- Geben Sie eine rechtliche Frage in das Eingabefeld ein, z. B. "Wie melde ich ein Patent an?".
- Klicken Sie auf "Absenden" und warten Sie, bis das Modell eine Antwort erzeugt hat.
- Zeigen Sie die Ausgabe an, die kopiert oder gespeichert werden kann.
Die Weboberfläche ist auch für technisch nicht versierte Benutzer geeignet und intuitiv zu bedienen.
caveat
- Hardware-VoraussetzungEs wird empfohlen, einen Grafikprozessor (z. B. Tesla V100) zu verwenden, um die Inferenz zu beschleunigen, da der CPU-Betrieb langsamer sein kann.
- Auswahl des ModellsDie Standardeinstellung ist die Verwendung von
LaWGPT-7B-alpha
Wenn Sie Folgendes benötigenbeta1.0
vielleichtbeta1.1
Die Modellparameter im Skript müssen angepasst werden. - EinschränkungenModelle können aufgrund von Datenbeschränkungen ungenaue Inhalte generieren, und die Ergebnisse müssen bei ihrer Verwendung, insbesondere in realen rechtlichen Szenarien, validiert werden.
Mit diesen Schritten können Sie einfach mit LaWGPT beginnen und erhalten effiziente Unterstützung, egal ob Sie juristische Quizze durchführen oder sich auf juristische Prüfungen vorbereiten.