AI Personal Learning
und praktische Anleitung
Sitzsack Marscode1

DeepSeek R1 in RAG: Eine Zusammenfassung der praktischen Erfahrungen

DeepSeek R1 in RAG: Zusammenfassung der praktischen Erfahrungen-1

DeepSeek R1 hat in seiner ersten Version starke Argumentationsfähigkeiten gezeigt. In diesem Blog-Beitrag erläutern wir die Details der Verwendung der DeepSeek R1 Erfahrung im Aufbau von Retrieval-Augmented Generation (RAG)-Systemen, insbesondere im Bereich der juristischen Dokumente.


Wir haben uns für Rechtsdokumente entschieden, weil Juristen oft vor einer entmutigenden Aufgabe stehen: dem Durchsuchen einer Fülle von Rechtssachen, Gesetzen und Gesetzestexten. Selbst die aufmerksamste Recherche kann durch die Schwierigkeit behindert werden, das richtige Dokument zu finden, geschweige denn den Inhalt genau zusammenzufassen. Genau an dieser Stelle RAG Bereiche, in denen Sie einen großen Unterschied machen können (siehe auch Harvey AI).

Wir haben eine RAG auf der Grundlage eines großen juristischen Dokumentendatensatzes erstellt und dabei DeepSeek R1 und Qwen2 als Einbettungsmodelle verwendet. Wir haben den gesamten RAG-Konstruktionsprozess als Open Source zur Verfügung gestellt (bereitgestellt von der vLLM im Gesang antworten SkyPilot Unterstützung) und teilten einige wertvolle Erfahrungen - was funktioniert und was nicht.

Wollen Sie es selbst erleben 🔥? Testen Sie unsere Online-Demo:Klicken Sie hier.

Wir haben diesen RAG-Erstellungsprozess als Open Source zur Verfügung gestellt Klicken Sie hier zur Ansicht. Entdecken Sie selbst, wie wir kombinieren vLLM + SkyPilot für schnelle, stabile und skalierbare Leistung.

DeepSeek R1 in RAG: Zusammenfassung der praktischen Erfahrungen-2

Warum eine RAG auf Rechtsdokumente aufbauen?

Retrieval Augmentation Generation (RAG) ist in Bereichen wie dem Recht, wo Genauigkeit und Nachvollziehbarkeit von größter Bedeutung sind, von entscheidender Bedeutung. Durch die Kombination eines spezialisierten Retrievers mit einem leistungsstarken Large Language Model (LLM) Generator können wir optimale Ergebnisse erzielen:

  1. von hochrelevanten Dokumentenabrufen (Daten)
  2. Texte mit ArgumentationskraftErzeugung von
  3. Durch direkte BezugnahmeVerringerung von Halluzinationen

Um diese RAG zu erstellen, haben wir verwendet:

  • Gesetzesstapel/Gesetzesstapel Eine Teilmenge des Datensatzes (mit Schwerpunkt auf Rechtsberatung);
  • ChromaDB Dient als Vektor-Repository zum Speichern und Abfragen von Einbettungen;
  • Qwen2 als Retrieval-Einbettungsmodell;
  • DeepSeek R1 Erstellen Sie ein Modell als endgültige Antwort.

Das gesamte System läuft auf vLLM oben, und kann durch die SkyPilot Nahtlose Bereitstellung in jeder Cloud, um optimale GPU-Verfügbarkeit und Kosteneffizienz zu gewährleisten. Der vollständige Open-Source-RAG-Build-Prozess ist hier verfügbar.

Wertvolle Erfahrung: Vorsichtsmaßnahmen und Kontraindikationen

1. nicht DeepSeek R1 für die Suche verwenden

(tun Sie es einfach) ohne zu zögern DeepSeek R1 hat ein ausgezeichnetes logisches Denkvermögen, aber esUngeeignetZum Erzeugen von Einbettungen - zumindest im Moment nicht.

Wir stellen fest, dass mit spezialisierten Einbettungsmodellen Alibaba-NLP/gte-Qwen2-7B-instruct(derzeit bei MTEB) die Charts (der Bestseller) (das am höchsten bewertete Einbettungsmodell) im Vergleich zu der von DeepSeek R1 erzeugten Einbettung.

Wir verwenden jedes dieser beiden Modelle, um Einbettungen für den Datensatz zu erzeugen und zwei Vektordatenbanken zu erstellen. Dann wird dieselbe Abfrage für beide Modelle verwendet und die 5 ähnlichsten Einbettungen in den jeweiligen Vektordatenbanken werden abgerufen.

Anfrage: 我收到了一张关于债务纠纷的小额索赔法庭传票,我应该如何准备?

Ergebnisse für: Qwen2 Suchergebnisse für DeepSeek-R1
[CA] Eine Frage zu geringfügigen Forderungen Kann ich ein Unternehmen verklagen, das Telefonverkäufer anstellt und mich trotz des Gesetzes ständig anruft?
[CO] Ich habe gerade eine gerichtliche Vorladung für eine Krankenhausrechnung erhalten, die von der Versicherung bezahlt wurde ...... Ich habe Beweise, aber muss ich dafür trotzdem einen Anwalt beauftragen? Was tun wir, wenn die Tochter einer Ex-Freundin wegen Ladendiebstahls verhaftet wird?
Ich werde verklagt, weil ich einen Kredit von 3.500 Dollar nicht zurückzahlen kann. Spätabends nach der Arbeit gehen Sie auf einen fast leeren Parkplatz und sehen zwei Männer, die an Ihrer Autotür herumschnüffeln. Sie sagen ihnen, sie sollen aufhören, aber sie ignorieren Sie. Sie sind im Besitz einer versteckten Pistole, was können Sie tun?
Die Katze einer Mitbewohnerin hat ein paar nussige Studentenfutter-Snacks gefressen und musste mit einer Rechnung von über 1.500 Dollar zum Tierarzt gehen. Sie droht damit, mich vor ein Gericht für Bagatellschäden zu bringen, damit ich dafür bezahle, aber es gibt keine Beweise dafür, dass die Snacks mir gehören. Sollte ich mir Sorgen machen? Anklage wegen Besitzes von Marihuana in Missouri ohne physische Beweise.
Ich habe vor kurzem eine zivilrechtliche Vorladung für eine Schuld erhalten, von der ich dachte, ich hätte sie bezahlt. Ist es legal, "einen Hund auf jemanden zu hetzen"?

Warum macht das einen Unterschied?

In der obigen Tabelle weist DeepSeek R1 deutlich schlechtere Ergebnisse auf. Warum ist das so?

Wir glauben, dass das grundlegende Problem in der Art und Weise liegt, wie DeepSeek R1 trainiert wird: Die Architektur von DeepSeek R1 konzentriert sich in erster Linie auf Inferenzen und betont sequentielles Denken und logische Verbindungen.Das bedeutet, dass DeepSeek R1 die Dokumente nicht in einem semantischen Raum abbildet.

Im Gegensatz dazu ist die Qwen2-Variante (gte-Qwen2-7B-instructTraining speziell für semantische Ähnlichkeitsaufgabendie einen hochdimensionalen Raum schaffen können, in dem konzeptionell ähnliche Dokumente unabhängig von ihrem spezifischen Wortlaut eng geclustert sind.

Dieser Unterschied im Trainingsansatz bedeutet, dass Qwen2 die Absicht einer Anfrage gut erfasst, während DeepSeek R1 manchmal Inferenzpfade verfolgt, die zu Ergebnissen führen, die zwar thematisch relevant, aber praktisch irrelevant sind.

DeepSeek R1 sollte nicht als Retrieval-Einbettungsmodell für RAGs verwendet werden, es sei denn, es wurde für die Einbettung feinabgestimmt.

2. die Generation mit R1: beeindruckende Argumentationskraft

(tun Sie es einfach) ohne zu zögern R1 Es gibt einige Schwierigkeiten bei der Einbettung, aber wir finden es Erzeugung von Die Fähigkeit, dies zu tun, ist bemerkenswert. Durch die Anwendung des R1-Gedankenkettenansatzes konnten wir feststellen:

  • Stärkere Kohärenz: Das Modell ist in der Lage, Informationen aus mehreren Dokumenten zusammenzufassen und relevante Passagen eindeutig zu referenzieren.
  • Verminderte Halluzinationen: R1 Begründen Sie intern "für sich selbst" und validieren Sie jede Schlussfolgerung mit Ihren Daten.

Schauen wir uns ein paar Beispiele an:

Beispiel 1: Beendigung des Mietverhältnisses

Frage: 我想解除租约,但房东不允许我这样做。

Den Denkprozess von DeepSeek R1 ansehen

Okay, ich möchte meinen Mietvertrag kündigen, aber der Vermieter lässt es nicht zu. Ich bin mir nicht sicher, welche Möglichkeiten ich habe. Ich versuche, die Dinge auf der Grundlage der zur Verfügung gestellten Unterlagen zu klären.

Erstens erinnere ich mich, in Papier 1 über die Strafe für die vorzeitige Beendigung eines Mietverhältnisses gelesen zu haben. Eine Person fragte, ob es möglich sei, ein Mietverhältnis nach 15 Monaten eines 18-monatigen Mietverhältnisses zu beenden, und die Antwort lautete ja, aber nur, wenn der Vermieter zustimmte oder ein neuer Mieter gefunden wurde. Wenn ich also das Mietverhältnis vorzeitig beenden wollte, könnte der Vermieter mich haftbar machen, wenn er nicht zustimmt oder schnell neu vermieten kann. Das scheint ein möglicher Weg zu sein, aber ich bin mir nicht sicher, ob mein Vermieter bereit wäre zu verhandeln.

In Aufsatz 2 ist der Grund für die Kündigung des Mietvertrags, dass jemand heiraten möchte. Die Antwort deutet darauf hin, dass der Mietvertrag möglicherweise die Zahlung einer Gebühr für die Auflösung des Mietverhältnisses vorsieht oder dass bis zum Ende der Laufzeit des Mietvertrags gewartet werden muss. Ich kann also prüfen, ob mein Mietvertrag eine Klausel enthält, die eine Kündigung zulässt, z. B. eine Untervermietungs- oder Abtretungsklausel. Ist dies nicht der Fall, muss ich möglicherweise eine Strafe zahlen oder bis zum Ende des Mietvertrags warten.

Papier 3 befasst sich mit der Beendigung eines Mietverhältnisses aufgrund eines Diensthundes. Zu den Optionen gehören die Zahlung einer Vertragsstrafe, die Untervermietung, die Suche nach einem anderen Diensthund oder das Abwarten, bis der Mietvertrag ausläuft. Das ist für mich nicht ganz nachvollziehbar, zeigt aber, dass die Beendigung eines Mietverhältnisses in der Regel Konsequenzen hat, es sei denn, es gibt einen besonderen Grund.

In Aufgabe 4 hatte der Vermieter die Miete erhöht, und der Nutzer beanstandete die kurze Kündigungsfrist. In der Antwort heißt es, dass theoretisch eine 30-tägige Kündigungsfrist gelten sollte, dass der Vermieter aber einen Kompromiss anbieten kann, z. B. die Zahlung der ursprünglichen Miete bis zum nächsten Mietverhältnis. Wenn mein Vermieter sich weigert, mich aus dem Mietvertrag zu entlassen, kann ich vielleicht versuchen, eine höhere Miete zu zahlen, aber ich weiß nicht, ob das in meinen finanziellen Möglichkeiten liegt.

In Dokument 5 wird erwähnt, dass der Vermieter sich weigerte, den Mietvertrag zu verlängern, weil er eine Katze hatte. In der Antwort hieß es, dass der Vermieter rechtlich nicht verpflichtet sei, den Mietvertrag zu verlängern, und daher die Möglichkeit habe, den Mietvertrag nicht zu verlängern. Das brachte mich auf den Gedanken, dass mein Vermieter möglicherweise über einen ähnlichen Ermessensspielraum verfügt, aber ich bin nicht sicher, ob dies der Grund für seine Ablehnung war.

In Aufgabe 6 wird die Situation erörtert, in der ein Mietvertrag verlängert wird und neue Bedingungen hinzugefügt werden. In der Antwort heißt es, dass der Vermieter den bestehenden Mietvertrag bis zu dessen Ablauf einhalten muss. Wenn der Vermieter sich also weigert, mich aus dem Mietvertrag zu entlassen, kann das bedeuten, dass er bis zum Ende des Mietvertrags warten muss, es sei denn, es gibt eine besondere Klausel im Mietvertrag, die es ihm erlaubt, den Mietvertrag nicht zu verlängern.

In den Papieren 7 und 8 werden die Schwierigkeiten von Vermietungsbüros bei der Verlängerung von Mietverträgen erörtert. In den Dokumenten wird erwähnt, dass der Vermieter den Mietvertrag möglicherweise aufgrund schlechter Bewertungen oder aus anderen Gründen nicht verlängern möchte, aber rechtlich gesehen kann der Vermieter entscheiden, den Mietvertrag nicht zu verlängern. Dies deutet darauf hin, dass der Vermieter zwar eine gewisse Macht hat, aber rechtlich nicht verpflichtet ist, mich vorzeitig aus dem Mietvertrag zu entlassen, es sei denn, es gibt einen besonderen Grund.

In Dokument 9 wird die Anforderung erörtert, vor dem Auszug eine 30-tägige Kündigungsfrist einzuhalten. Auch wenn ich einziehe, ohne einen Vertrag zu unterzeichnen, kann der Vermieter eine Kündigungsfrist verlangen. Wenn ich also ohne Vorankündigung ausziehe, kann ich mit Geldstrafen rechnen oder muss für den Rest der Mietdauer Miete zahlen.

Papier 10 schließlich befasst sich mit der Situation, dass der Mieter für die gesamte Miete verantwortlich ist, wenn der Mitbewohner auszieht. In der Antwort wird vorgeschlagen, die Miete durch Untervermietung zu teilen. Wenn ich ausziehen würde, könnte ich vielleicht versuchen, meinen Teil des Mietvertrags unterzuvermieten, aber das hängt von den Bedingungen des Mietvertrags ab.

Zusammenfassend kann ich sagen, dass ich prüfen muss, ob mein Mietvertrag eine Klausel über die vorzeitige Kündigung enthält. Wenn nicht, muss ich möglicherweise eine Vertragsstrafe zahlen, es sei denn, der Vermieter stimmt zu. Wenn ich einen triftigen Grund habe, z. B. einen Umzug, kann ich versuchen, mit dem Vermieter zu verhandeln. Wenn eine Untervermietung möglich ist, könnte das eine Lösung sein, aber ich muss prüfen, ob der Mietvertrag dies zulässt. Ich sollte auch überlegen, ob ich bis zum natürlichen Ende des Mietvertrags warten kann, wenn ich keine andere Möglichkeit finde.

Antwort von DeepSeek R1 anzeigen

Auf der Grundlage einer Analyse der vorgelegten Unterlagen wird im Folgenden ein strukturierter Ansatz für die Beendigung eines Mietvertrags vorgestellt, wenn der Vermieter eine vorzeitige Kündigung ablehnt:

1. die Überprüfung von Mietverträgen
Klauseln zur vorzeitigen Kündigung: Prüfen Sie, ob Ihr Mietvertrag Klauseln zur vorzeitigen Kündigung enthält. Wenn eine solche Klausel besteht, sind Sie möglicherweise gesetzlich verpflichtet, eine Vertragsstrafe zu zahlen oder Ihrem Vermieter eine Vorankündigung zukommen zu lassen, um den Mietvertrag zu beenden [1].
Untervermietung oder Abtretung: Stellen Sie fest, ob Ihr Mietvertrag Ihnen die Untervermietung oder Abtretung des Mietvertrags an eine andere Person erlaubt. Dies kann Ihnen helfen, Geldstrafen oder Gerichtsverfahren zu vermeiden [2].
2. die Diskretion des Vermieters zu verstehen
Ermessensabhängige Verlängerungen: Der Vermieter kann das Recht haben, die Verlängerung des Mietvertrags abzulehnen, insbesondere wenn Ihr Mietvertrag keine Klausel enthält, die eine vorzeitige Kündigung ausdrücklich zulässt. In diesem Fall sind Sie möglicherweise verpflichtet, den Mietvertrag bis zum Ende der Laufzeit einzuhalten [6][8].
3. die Berücksichtigung der finanziellen Folgen
Strafen: Stellen Sie sich darauf ein, dass Sie möglicherweise mit finanziellen Strafen rechnen müssen, wenn Sie Ihr Mietverhältnis ohne Zustimmung Ihres Vermieters vorzeitig beenden. Dazu könnten zusätzliche Mietzahlungen oder eine Schadenskaution gehören [1][9].
4. die Erkundung von Verhandlungen
Verhandeln Sie die Bedingungen: Wenn Sie einen triftigen Grund für eine vorzeitige Kündigung haben, z. B. einen Umzug, können Sie mit Ihrem Vermieter eine geringere Vertragsstrafe oder die Erlaubnis zur vorzeitigen Beendigung des Mietverhältnisses aushandeln [2].
5. die Untervermietung als Lösung
Untervermietung: Wenn möglich, sollten Sie einen Teil Ihres Mietvertrags untervermieten, um Ihre finanziellen Verpflichtungen zu erfüllen [10].
6. die Planung für die Zukunft
Warten Sie bis zum Ende des Mietvertrags: Wenn eine vorzeitige Kündigung nicht möglich ist, planen Sie, bis zum Ablauf des Mietvertrags zu bleiben. So lassen sich Geldstrafen und rechtliche Probleme vermeiden [6][8].
Schlussfolgerung:

Lesen Sie die Bedingungen Ihres Mietvertrags immer sorgfältig durch, bevor Sie etwas unternehmen. Wenn eine vorzeitige Kündigung nicht zulässig ist, sollten Sie eine Untervermietung in Betracht ziehen oder das Ende des Mietvertrags abwarten. Wenn Sie mit Ihrem Vermieter verhandeln können, ist dies möglicherweise die beste Lösung. Wenden Sie sich immer an einen Rechtsbeistand, um sich in Ihrer speziellen Situation beraten zu lassen.

Beispiel 2: Gericht für geringfügige Forderungen

Frage. 我收到了一张关于争议债务的小额索赔法院传票。我应该如何准备?

Den Denkprozess von DeepSeek R1 ansehen

Okay, ich habe gerade eine Vorladung zum Bagatellgericht wegen einer strittigen Forderung erhalten. Ich bin mir nicht ganz sicher, wo ich anfangen soll, aber ich muss herausfinden, wie ich mich darauf vorbereiten kann. Nach den Suchergebnissen zu urteilen, gibt es ein paar Leute, die ähnliche Situationen durchgemacht haben, also kann ich vielleicht etwas von ihren Erfahrungen lernen.

Zunächst einmal sollte ich wohl die Art der Schuld verstehen. In Dok 5 erhält jemand eine Vorladung für eine Schuld, von der er dachte, dass er sie bereits bezahlt hat. Sie verstehen nicht, warum sie eine weitere Mahnung erhalten haben. Ich muss also überprüfen, ob diese Schuld gültig ist. Vielleicht sollte ich meine Unterlagen prüfen oder den Gläubiger um einen Schuldnachweis bitten. Laut Dokument 10 ist es eine gute Idee, die Beschwerde abzulehnen und einen Nachweis zu verlangen. Auf diese Weise kann ich die Glaubwürdigkeit der Forderung in Frage stellen.

Als nächstes sollte ich meinen Fall vorbereiten. In Dokument 1 hat sich jemand mit einem ähnlichen Problem befasst und der Rat war, sicherzustellen, dass der Fall in 10 Minuten oder weniger präsentiert werden kann. Das bedeutet, dass ich mich kurz fassen und alle meine Beweise organisieren muss. Ich sollte alle Dokumente sammeln, die beweisen, dass ich die Schulden nicht schulde, z. B. Zahlungsbelege, Briefe von Gläubigern, die einen Vergleich anzeigen, oder Versicherungsunterlagen wie in Dokument 2.

Ich muss auch das Problem der Zeugen berücksichtigen. In Dokument 4 droht ein Mitbewohner, diese Person wegen einer Tierarztrechnung zu verklagen, und der Rat lautet, die Drohung zu ignorieren, solange man nicht verklagt wird. Wenn ich jedoch verklagt werde, sollte ich darauf vorbereitet sein, Zeugen zu haben, die mich unterstützen. Vielleicht einen Freund, der zu der Zeit bei mir war, als ich zu zahlen versuchte, oder einen ehemaligen Mieter, der den Zustand des Hauses bezeugen kann, wie in Dokument 7 dargestellt.

Es ist wichtig, das Gerichtsverfahren zu verstehen. Wie in Dokument 7 dargestellt, legte der Vermieter nach einem gewonnenen Verfahren vor dem Bagatellgericht Berufung ein, was bedeutete, dass er oder sie erneut vor Gericht erscheinen musste. Die Person musste das gleiche Verfahren erneut durchlaufen. Ich sollte also wissen, dass, selbst wenn ich gewinne, noch ein Berufungsverfahren eingeleitet werden kann. Ich sollte darauf vorbereitet sein, meinen Fall bei Bedarf erneut vorzutragen.

Ich muss auch Vorladungen und Schriftsätze berücksichtigen. In Doc 5 muss jemand auf die Schriftsätze antworten. Wenn ich das nicht tue, kann ein Versäumnisurteil ergehen. Daher muss ich rechtzeitig antworten und meine Verteidigung klar darlegen.

Der nächste Schritt ist die Einreichung einer Verteidigungsanzeige. In Dokument 10 heißt es, dass ich selbst bei einem Angebot immer ablehnen und einen Beweis verlangen sollte. Dies wird mir bei späteren Verhandlungen mehr Einfluss verschaffen. In meiner Klageerwiderung werde ich alle meine Argumente und Beweise auflisten.

Es ist auch wichtig, meine finanzielle Situation zu berücksichtigen. In Dok. 6 wurde die Sorge geäußert, wegen Zahlungsunfähigkeit inhaftiert zu werden, aber es wurde klargestellt, dass es kein Schuldnergefängnis gibt. Dennoch sollte ich mit dem Gericht über meine finanzielle Situation sprechen. Wenn ich nicht zahlen kann, muss ich nachweisen, dass ich mich in angemessener Weise bemüht habe, und einen Ratenzahlungsplan anbieten, wie in Dokument 5 dargestellt.

Wenn ich mir in einer rechtlichen Frage unsicher bin, sollte ich vielleicht einen Anwalt konsultieren. In Dokument 3 zieht die Person um und hat einen Gerichtstermin. Es könnte hilfreich sein, einen Anwalt für Schuldenregulierung zu konsultieren, insbesondere wenn ich noch andere Schulden oder Komplikationen habe.

Schließlich sollte ich auf die Gerichtsverhandlung vorbereitet sein. Es ist wichtig, pünktlich zu erscheinen, sich angemessen zu kleiden und alle Unterlagen bereitzuhalten. In Dokument 7 hat diese Person den Fall gewonnen, weil sie gut mit Beweisen vorbereitet war, also sollte ich es ihr gleichtun.

Zusammengefasst muss ich: Schulden überprüfen, Beweise vorbereiten, Gerichtsverfahren verstehen, korrekt auf Vorladungen reagieren, eventuell einen Anwalt konsultieren und für die Verhandlung organisiert und vorbereitet sein. Die Angabe relevanter Dokumente wird mir helfen, meine Entscheidungen zu untermauern.

Antwort von DeepSeek R1 anzeigen

Auf der Grundlage der Analyse der zur Verfügung gestellten Rechtsdokumente wird im Folgenden ein strukturierter und organisierter Plan für die Vorbereitung von Mahnbescheiden für strittige Forderungen erstellt:

Überprüfung der Schulden
Prüfen Sie die Nachweise des Gläubigers: Prüfen Sie zunächst alle vom Gläubiger vorgelegten Unterlagen, um die Gültigkeit und die Einzelheiten der Forderung zu bestätigen. Nutzen Sie diese Informationen, um sie mit Ihren eigenen Unterlagen oder früheren Mitteilungen abzugleichen.
Anforderung von Dokumenten: Wenden Sie sich an den Gläubiger, um einen formellen Nachweis der Schulden zu verlangen, z. B. ein Gerichtsurteil oder eine Vergleichsvereinbarung. Dieser Schritt ist wichtig, um die Glaubwürdigkeit der Schulden in Frage zu stellen, wie in Papier 10 empfohlen.
Vorbereitung Ihres Falls
Sammeln von Beweisen: Sammeln Sie alle relevanten Beweise, wie z. B. Zahlungsbelege, Schreiben von Gläubigern, die einen Vergleich anzeigen, oder Versicherungsunterlagen, wie in den Dokumenten 2 und 8 erwähnt.
Organisation und Vorlage von Beweismitteln: Stellen Sie sicher, dass alle Beweismittel organisiert und für die Vorlage vor Gericht vorbereitet sind, und befolgen Sie die Hinweise in Dokument 1. Ziehen Sie bei Bedarf Zeugenaussagen in Betracht, z. B. von Freunden, die bei den Zahlungsversuchen anwesend waren, oder von ehemaligen Mietern der betreffenden Immobilie.
Verständnis von Gerichtsverfahren
Seien Sie auf mehrere Anhörungen vorbereitet: Wenn Sie Ihren Fall gewinnen, sollten Sie sich darüber im Klaren sein, dass es ein Berufungsverfahren geben kann, wie in Dokument 7 beschrieben. Seien Sie darauf vorbereitet, Ihren Fall erforderlichenfalls erneut vorzutragen.
Machen Sie sich mit den Gerichtsverfahren vertraut: Lernen Sie die Grundlagen eines kleinen Gerichts kennen, einschließlich des Aufbaus der Verhandlung und der Rolle des Richters.
Reaktion auf Vorladungen und Anklageerhebungen
Reichen Sie eine Klageerwiderung ein: Stellen Sie sicher, dass Sie rechtzeitig auf den Mahnbescheid reagieren, um ein Versäumnisurteil zu vermeiden. Legen Sie in Ihrer Klageerwiderung Ihre Verteidigung klar dar und verlangen Sie einen Schuldnachweis, wie in Dokument 10 empfohlen.
Bestreiten der Anklage: Bestreiten Sie immer die Anklage, um Verhandlungsmöglichkeiten zu nutzen, wie in Dokument 10 erwähnt.
Berücksichtigung der finanziellen Situation
Legen Sie Ihre finanzielle Situation dar: Wenn Sie nicht in der Lage sind, Ihre Schulden zu begleichen, weisen Sie Ihre finanzielle Situation nach und legen Sie einen Ratenzahlungsplan vor, wie in Dokument 5 beschrieben. Weisen Sie nach, dass Sie angemessene Anstrengungen unternommen haben, um die Schulden zu begleichen.
Gegebenenfalls einen Anwalt konsultieren
Lassen Sie sich rechtlich beraten: Wenn die Situation komplex ist oder Sie sich über Ihre Rechtslage nicht im Klaren sind, sollten Sie einen Anwalt für Schuldenregulierung konsultieren, insbesondere wenn weitere Schulden oder komplexe Sachverhalte im Spiel sind, wie in Dokument 3 vorgeschlagen.
Vorbereitung auf Gerichtsverhandlungen
Seien Sie pünktlich und vorbereitet: Kommen Sie rechtzeitig, kleiden Sie sich angemessen und bringen Sie alle erforderlichen Unterlagen mit. Siehe das Beispiel in Dokument 7 für einen erfolgreichen Ausgang eines gut vorbereiteten Falls.
Berücksichtigen Sie die zusätzlichen Schritte
Benachrichtigen Sie Mitbewohner oder Zeugen: Wenn die Schulden gemeinsames Eigentum betreffen, sollten Sie Zeugen oder Mitbewohner benachrichtigen, die Sie unterstützen können, wie in Dokument 4 erwähnt.

Wenn Sie diese Schritte befolgen, können Sie selbstbewusst auf eine Anhörung vor einem Gericht für geringfügige Forderungen reagieren, sicherstellen, dass Ihr Fall effektiv dargestellt wird, und Ihre Rechte schützen.

Anhand dieser Beispiele können wir feststellen, dass DeepSeek R1 über ausgezeichnete logische Fähigkeiten verfügt. Sein Denkprozess zeigt deutlich, wie man Schlussfolgerungen aus juristischen Quelldokumenten ziehen kann:

  • R1 konstruiert zunächst eine kohärentes Modell Rechtsfragen zu verstehen, was sich in einer detaillierten Argumentation niederschlägt:首先,我记得关于提前终止罚款的内容……文档 1 提到…… Dieser Ansatz des "Reasoning before Retrieval" ermöglicht es dem Modell, Konzepte aus verschiedenen Quellen vor dem Abruf systematisch zu verknüpfen.
  • Bei komplexen Szenarien wie der Beendigung eines Mietverhältnisses oder der Beilegung von Streitigkeiten mit geringem Streitwert stellen wir fest, dass R1 Keine Halluzinationen. anstatt explizit zu klären, wie es die einzelnen Dokumente versteht (综合来看……).
  • Schließlich erläutert der Generator seine Argumentation mit präzisen Verweisen, die die Schlussfolgerung mit der Quelle verknüpfen. Dies gewährleistet eine klare Kette von der Frage über die Argumentation bis zur Antwort und garantiert Strenge und Zugänglichkeit.

Wir haben verschiedene juristische Abfragen ausprobiert und festgestellt, dass das Modell nicht nur in der Lage ist, Informationen aus den Quelldokumenten zu extrahieren, sondern auch deren Inhalt zu lernen und zu verstehen.

Schlussfolgerung: Bei den Aufgaben "Frage und Antwort" und "Zusammenfassung" müssen dieR1 Es ist eine "Goldmine" der schrittweisen juristischen Argumentation. Verwenden Sie es in der generativen Phase und Sie werden kaum enttäuscht sein.

3. die Technik bleibt wichtig

Queue-Design

Fortgeschrittene Argumentationsfähigkeiten machen den Bedarf an gut gestalteten Stichworten nicht überflüssig. Wir haben festgestellt, dass explizite Anleitungen in Form von Stichwörtern wesentlich sind für

  • (jemanden dazu bringen, etw. zu tun) Belegbezug Generieren Sie durchgängig Antworten.
  • Verhinderung von Halluzinationen Es wird der Ansatz "zitiere eine Quelle oder gib an, dass du es nicht weißt" verwendet.
  • Strukturierung der endgültigen Antwort, um sie besser lesbar zu machen .

Während des Experiments haben wir die folgenden Stichwörter gebildet:

你是一个帮助分析法律文件及相关内容的 AI 助手。在回复时,请遵循以下准则:
- 在提供的搜索结果中,每个文档的格式为 [Document X begin]...[Document X end],其中 X 表示文档的编号。
- 使用 [citation:X] 形式的引用格式,其中 X 是文档编号,并将引用放在相关信息之后。
- 在整个回答中加入引用,而不仅仅是结尾处。
- 如果信息来自多个文档,请使用多个引用,例如 [citation:1][citation:2]。
- 不是所有搜索结果都相关——请评估并仅使用相关信息。
- 对于较长的回答,请将内容结构化,以段落或部分的形式呈现,以提高可读性。
- 如果在提供的文档中找不到答案,请直接说明,而不要编造信息。
- 一些文档可能是非正式讨论或 Reddit 帖子——请根据内容调整解读方式。
- 让回答尽可能多地包含引用。
首先,在 <think> 标签中解释你的思维过程。
然后,在思维过程之后提供最终答案。

Chunking von Dokumenten

Darüber hinaus haben wir festgestellt, dass Effizientes Chunking von Dokumenten ist für ein präzises Auffinden von Dokumenten unerlässlich. Das Chunking des Dokuments trägt dazu bei, dass jede Einbettung ein bestimmtes Thema genauer wiedergibt, und verringert den Zeitaufwand für die Erstellung jeder Einbettung Token Menge.

Wir verwenden eine satzbasierte Segmentierung (über NLTK), um Dokumente in Chunks zu unterteilen. Außerdem enthalten der Anfang und das Ende jedes Chunks Inhalte, die sich mit benachbarten Chunks überschneiden. Dies hilft dem Modell, Teilverweise besser zu verstehen, ohne den Gesamtkontext zu verlieren. Nachfolgend ist der für das Chunking von Dokumenten verwendete Code dargestellt:

def chunk_document(document, chunk_size=2048, overlap=512):
"""使用基于句子的分割方法将文档拆分为重叠的块。"""
text = document['text']
chunks = []
# 先按句子分割
sentences = nltk.sent_tokenize(text)
current_chunk = []
current_length = 0
for sentence in sentences:
sentence_len = len(sentence)
# 如果加入此句子后会超出块大小,则保存当前块
if current_length + sentence_len > chunk_size and current_chunk:
chunk_text = ' '.join(current_chunk)
chunks.append({
'id': document['id'],
'name': document['name'],
'content': document['text'],
'chunk_start': len(' '.join(current_chunk[:-(2 if overlap > 0 else 0)])) if overlap > 0 else 0,
# 其他元数据字段...
})
# 保留最后几句话作为重叠部分
overlap_text = ' '.join(current_chunk[-2:])  # 保留最后 2 句
current_chunk = [overlap_text] if overlap > 0 else []
current_length = len(overlap_text) if overlap > 0 else 0
current_chunk.append(sentence)
current_length += sentence_len + 1  # +1 代表空格

Zusammenfassung der wichtigsten Punkte:

  1. Verwenden Sie NLTK für satzbasiertes Token-Splitting, nicht für zeichenbasiertes Splitting.
  2. Der Dokumentenkontext wird beibehalten, indem überlappende Sätze zwischen den Blöcken beibehalten werden.

4. vLLM ist effizient und schnell

Aufgrund der schieren Menge an juristischen Dokumentendaten kann die Erstellung von Einbettungen für die RAG sehr lange dauern.

Ursprünglich haben wir HuggingFace's sentence_transformerWir haben es zuerst auf einem Nvidia L4-Grafikprozessor ausgeführt, sind aber auf die übliche Fehlermeldung "CUDA-Speicher nicht ausreichend" gestoßen. Wir haben es zunächst auf einem Nvidia L4-Grafikprozessor laufen lassen, sind aber auf den üblichen Fehler "CUDA-Speicher nicht ausreichend" gestoßen. Danach haben wir es mit der Nvidia A100 versucht und festgestellt, dass die sentence_transformer 57 GB DRAM sind erforderlich, um das komplette Programm zu laden. Alibaba-NLP/gte-Qwen2-7B-instruct Modelle.

DeepSeek R1 in RAG: Zusammenfassung der praktischen Erfahrungen-3

Wir wechselten zu vLLMDies ist eine speichereffiziente LLM-Inferenz- und Service-Engine mit hohem Durchsatz.

Mit vLLM können wir das Modell auf einer Standard-Nvidia L4 GPU (~24GB DRAM) ausführen. Im Vergleich ist der L4 viel günstiger als der A100: Auf GCP kostet der Nvidia L4 etwa $0,7/Stunde, während der Nvidia A100 mindestens $2,9/Stunde kostet.

Ein Vergleich von vLLM und Satzumwandler auf einer Nvidia A100 (80 GB DRAM) zeigt, dass vLLM erzeugt Qwen2-Einbettungen bis zu 5,5 Mal schneller!.

Bei der Verarbeitung von 10.000 juristischen Dokumenten (insgesamt 15.000 Chunks):

  • Standard-Satz Transformator Bearbeitungszeit: ca. 5,5 Stunden
  • vLLM-Bearbeitungszeit: ca. 1 Stunde

DeepSeek R1 in RAG: Zusammenfassung der praktischen Erfahrungen-4

Für die Ausführung auf vLLM werden verwendet Alibaba-NLP/gte-Qwen2-7B-instruct um eine eingebettete SkyPilot-YAML-Konfiguration zu erzeugen:

name: compute-legal-embeddings
resources:
# vLLM 需要 ~24GB DRAM GPU,SentenceTransformer 需要 57GB
accelerators: {L4:1, A100:1} 
envs:
START_IDX: ${START_IDX}
END_IDX: ${END_IDX}
file_mounts:
/output:
name: my-bucket-for-embedding-output
mode: MOUNT
setup: |
pip install torch==2.5.1 vllm==0.6.6.post
...
envs: 
MODEL_NAME: "Alibaba-NLP/gte-Qwen2-7B-instruct"
run: |
python -m vllm.entrypoints.openai.api_server \
--host 0.0.0.0 \
--model $MODEL_NAME \
--max-model-len 3072 \
--task embed &
python scripts/compute_embeddings.py \
--start-idx $START_IDX \
--end-idx $END_IDX \
--chunk-size 2048 \
--chunk-overlap 512 \
--vllm-endpoint http://localhost:8000

5) Lassen Sie nicht zu, dass das Einbetten über 100 Stunden dauert - nutzen Sie SkyPilot für die parallele Verarbeitung!

Die Erstellung von Einbettungen für juristische Dokumente auf einem einzigen L4-GPU dauert 100 Stunden. Wir können Spot-Instanzen nutzen, um Zeit und Kosten drastisch zu reduzieren:

Name (einer Sache) ursprüngliche Uhrzeit 100 Spot-Beispiele
mal 100 Stunden 1 Stunde (100-fache Beschleunigung)
(Herstellungs-, Produktions- usw.) Kosten $70.1 | $28.2 (2,4-fache Einsparung)

DeepSeek R1 in RAG: Zusammenfassung der praktischen Erfahrungen-5

Ergebnisse: Wir müssen nicht mehr tagelang auf die Erstellung von Einbettungen warten. Unsere Aufgaben lassen sich dynamisch skalieren, so dass wir selbst bei großen Datenmengen schnell vom Prototyp zur Produktion übergehen können.

zu einem Urteil gelangen

(etwas Abstraktes) konstruieren DeepSeek R1 RAG Lassen Sie uns ein paar wichtige Punkte lernen:

  1. Verbessern Sie die Abrufmöglichkeiten mit speziellen Einbettungsmodellen wie Qwen2.
  2. Die Argumentationsfähigkeiten von R1 werden in der Generierungsphase genutzt, um komplexe juristische Anfragen zu bearbeiten.
  3. (Stichwort) Technik bleibt der Schlüssel zur Kontrolle von Zitaten und zur Strukturierung von Inhalten.
  4. Verbessern Sie die Inferenz-Effizienz mit vLLM, um die Geschwindigkeit deutlich zu erhöhen.
  5. Skalieren Sie KI-Computing in der Cloud und auf Ihrer eigenen Infrastruktur, um Rechenzeit und Kosten zu reduzieren.

Möchten Sie mehr erfahren?

Achtung! Das RAG-System ist ein leistungsfähiges Instrument für juristische Recherchen und Analysen, kann aber einen qualifizierten Rechtsbeistand nicht ersetzen. Seine Ergebnisse sollten nicht als Rechtsberatung angesehen werden.

Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " DeepSeek R1 in RAG: Eine Zusammenfassung der praktischen Erfahrungen
de_DEDeutsch