AI Personal Learning
und praktische Anleitung
豆包Marscode1

Claude's Guide to Common Use Cases: Juristische Schriftsätze

Dieser Leitfaden beschreibt, wie Sie die fortschrittlichen Funktionen von Claude zur Verarbeitung natürlicher Sprache nutzen können, um juristische Dokumente effizient zusammenzufassen, wichtige Informationen zu extrahieren und die juristische Recherche zu beschleunigen. Mit Claude können Sie die Vertragsprüfung, die Vorbereitung auf Rechtsstreitigkeiten und die Einhaltung von Vorschriften rationalisieren und so Zeit sparen und die Genauigkeit des rechtlichen Prozesses sicherstellen.

Besuchen Sie unser Abstrakte Rezepte sehen Sie eine Beispielimplementierung der juristischen Zusammenfassung mit Claude.

Vor dem Bau mit Claude

Entscheidung über die Verwendung von Claude für juristische Schriftsätze

Hier sind einige wichtige Hinweise für die Zusammenfassung von Rechtsdokumenten mit einem LLM wie Claude:

Sie wollen große Mengen von Dokumenten effizient und wirtschaftlich prüfen


Die manuelle Prüfung umfangreicher Dokumente kann zeitaufwändig und kostspielig sein. Claude kann große Mengen juristischer Dokumente schnell verarbeiten und zusammenfassen und so den Zeit- und Kostenaufwand für die Prüfung von Dokumenten erheblich reduzieren. Diese Fähigkeit ist besonders wertvoll bei Aufgaben wie Due-Diligence-Prüfungen, Vertragsanalysen oder der Offenlegung von Rechtsstreitigkeiten, wo Effizienz entscheidend ist.

Sie müssen die wichtigsten Metadaten automatisch extrahieren

Claude extrahiert und kategorisiert effizient wichtige Metadaten aus juristischen Dokumenten, wie z. B. die beteiligten Parteien, Daten, Vertragsbedingungen oder bestimmte Klauseln. Diese automatische Extraktion kann helfen, Informationen zu organisieren und die Suche, Analyse und Verwaltung großer Dokumentensammlungen zu erleichtern. Sie ist besonders nützlich für die Vertragsverwaltung, die Überprüfung der Einhaltung von Vorschriften oder die Erstellung durchsuchbarer Datenbanken mit juristischen Informationen.

Sie wollen klare, prägnante und standardisierte Zusammenfassungen erstellen

Claude erstellt strukturierte Zusammenfassungen, die einem vordefinierten Format folgen und es Juristen ermöglichen, die wichtigsten Punkte verschiedener Dokumente schnell zu erfassen. Diese standardisierten Zusammenfassungen verbessern die Lesbarkeit, erleichtern den Vergleich zwischen Dokumenten und verbessern das Gesamtverständnis, insbesondere wenn es um komplexe Rechtssprache oder Fachterminologie geht.

Sie müssen Ihre Zusammenfassungen genau zitieren

Bei der Erstellung von juristischen Zusammenfassungen sind korrekte Quellenangaben und Zitate unerlässlich, um die Glaubwürdigkeit und die Einhaltung rechtlicher Standards zu gewährleisten.Claude kann dazu aufgefordert werden, genaue Zitate für alle zitierten Gesetzesstellen anzugeben, was es Juristen erleichtert, die zusammengefassten Informationen zu überprüfen und zu bestätigen.

Sie möchten den juristischen Rechercheprozess vereinfachen und beschleunigen

Claude kann bei der juristischen Recherche helfen, indem es große Mengen an Rechtsprechung, Gesetzen und Gesetzestexten schnell analysiert. Es identifiziert relevante Präzedenzfälle, extrahiert die wichtigsten Rechtsgrundsätze und fasst komplexe rechtliche Argumente zusammen. Diese Fähigkeit kann den Rechercheprozess erheblich beschleunigen, so dass sich Juristen auf die Analyse auf höherer Ebene und die Entwicklung von Strategien konzentrieren können.

Identifizieren Sie die Details, die Sie in der Zusammenfassung extrahieren möchten

Es gibt nicht die eine richtige Zusammenfassung für ein bestimmtes Dokument. Ohne klare Vorgaben kann Claude Schwierigkeiten haben, zu entscheiden, welche Details er aufnehmen soll. Die besten Ergebnisse erzielen Sie, wenn Sie die spezifischen Informationen angeben, die Sie in die Zusammenfassung aufnehmen möchten.

Wenn Sie zum Beispiel einen Untermietvertrag zusammenfassen, können Sie die folgenden Kernpunkte herausnehmen:

details_to_extract = [
    '相关方(转租人、转租承租人和原出租人)',
    '物业详情(地址、描述和允许用途)', 
    '期限和租金(开始日期、结束日期、月租金和保证金)',
    '责任(公用设施、维护和维修)',
    '同意和通知(房东的同意和通知要求)',
    '特别条款(家具、停车位和转租限制)'
]

Erarbeitung von Erfolgskriterien

Die Bewertung der Qualität von Zusammenfassungen ist bekanntermaßen eine schwierige Aufgabe. Im Gegensatz zu vielen anderen Aufgaben der natürlichen Sprachverarbeitung gibt es für die Bewertung von Zusammenfassungen in der Regel keine klaren, objektiven Maßstäbe. Der Prozess ist oft sehr subjektiv, und verschiedene Leser können verschiedene Aspekte der Zusammenfassungen unterschiedlich bewerten. Hier ist, was Sie bei der Bewertung erwarten können Claude Kriterien, die bei der Umsetzung des Schriftsatzes berücksichtigt werden müssen.

Sachliche Richtigkeit

Die Zusammenfassung sollte den Sachverhalt, die Rechtsbegriffe und die wichtigsten Punkte des Dokuments genau wiedergeben.

Rechtliche Präzision

Die Terminologie und die Verweise auf Gesetze, Rechtsprechung oder Vorschriften müssen korrekt sein und den rechtlichen Standards entsprechen.

Einfachheit

Die Zusammenfassung sollte das Rechtsdokument auf seine Kernpunkte komprimieren, ohne wichtige Details auszulassen.

Konsistenz

Bei der Zusammenfassung mehrerer Dokumente sollte das große Sprachmodell eine einheitliche Struktur und Verarbeitung für jede Zusammenfassung beibehalten.

Lesbarkeit

Der Text sollte klar und einfach zu verstehen sein. Wenn das Publikum kein Rechtsexperte ist, sollte die Zusammenfassung keine Rechtsbegriffe enthalten, die das Publikum verwirren könnten.

Voreingenommenheit und Unparteilichkeit

Die Zusammenfassungen sollten faire und unvoreingenommene rechtliche Argumente und Positionen enthalten.

Lesen Sie unseren Leitfaden, um mehr zu erfahren über Erarbeitung von Erfolgskriterien Die Nachricht.


Verwendung von Claude zur Zusammenfassung von Rechtsdokumenten

Auswahl des richtigen Claude-Modells

Bei der Zusammenfassung von Rechtsdokumenten ist die Genauigkeit des Modells entscheidend, und Claude 3.5 Sonnet ist eine ausgezeichnete Wahl für solche Anwendungsfälle, bei denen ein hohes Maß an Genauigkeit erforderlich ist. Wenn der Umfang und die Anzahl der Dokumente groß ist und die Kosten ein Problem darstellen, können Sie auch ein kleineres Modell wie Claude 3 Haiku verwenden.

Um diese Kosten abschätzen zu können, werden hier die Kosten für die Zusammenfassung von 1.000 Untermietverträgen mit Sonnet und Haiku verglichen:

  • Umfang des Inhalts
    • Anzahl der Vereinbarungen: 1.000
    • Zeichen pro Abkommen: 300.000
    • Zeichen insgesamt: 300M
  • Geschätzte Token
    • Eingabe-Token: 86M (Annahme 1) Token (entspricht 3,5 Zeichen)
    • Ausgabe von Token pro Zusammenfassung: 350
    • Gesamtzahl der ausgegebenen Token: 350.000
  • Claude 3.5 Sonnet Geschätzte Kosten
    • Token-Kosten eingeben: 86 MTok * $3.00/MTok = $258
    • Kosten für Output-Token: 0,35 MTok * $15,00/MTok = $5,25
    • Gesamtkosten: $258.00 + $5.25 = $263.25
  • Claude 3 Haiku Geschätzte Kosten
    • Kosten für Input-Token: 86 MTok * $0,25/MTok = $21,50
    • Kosten für Output-Token: 0,35 MTok * $1,25/MTok = $0,44
    • Gesamtkosten: $21.50 + $0.44 = $21.96

Die tatsächlichen Kosten können von diesen Schätzungen abweichen. Die obigen Schätzungen beruhen auf Aufforderung Beispiele in den Kapiteln.

Dateien in ein Format konvertieren, das Claude verarbeiten kann

Bevor Sie mit der Zusammenfassung eines Dokuments beginnen können, müssen Sie die Daten vorbereiten. Dazu gehört das Extrahieren des Textes aus der PDF-Datei, das Bereinigen des Textes und das Sicherstellen, dass er von Claude verarbeitet werden kann.

Nachfolgend finden Sie eine Demonstration dieses Prozesses anhand eines PDF-Beispiels:

from io import BytesIO
import re

import pypdf
import requests

def get_llm_text(pdf_file):
    reader = pypdf.PdfReader(pdf_file)
    text = "\n".join([page.extract_text() for page in reader.pages])

    # 去除多余的空格
    text = re.sub(r'\s+', ' ', text) 

    # 去除页码
    text = re.sub(r'\n\s*\d+\s*\n', '\n', text) 

    return text

# 从 GitHub 仓库创建完整的 URL
url = "https://raw.githubusercontent.com/anthropics/anthropic-cookbook/main/skills/summarization/data/Sample Sublease Agreement.pdf"
url = url.replace(" ", "%20")

# 下载 PDF 文件到内存中
response = requests.get(url)

# 从内存加载 PDF
pdf_file = BytesIO(response.content)

document_text = get_llm_text(pdf_file) 
print(document_text[:50000])

In diesem Beispiel haben wir zunächst eine PDF-Datei eines Untermietvertrags von der Zusammenfassungskochbuch . Die Vereinbarung geht zurück auf die sec.gov-Website Der Untermietvertrag, der im Internet veröffentlicht wurde

Wir verwenden die pypdf-Bibliothek, um den Inhalt der PDF-Datei zu extrahieren und in Text zu konvertieren. Die Textdaten werden dann bereinigt, indem überflüssige Leerzeichen und Seitenzahlen entfernt werden.

Leistungsstarke Stichwörter aufbauen

Claude kann an eine Vielzahl von Zusammenfassungsstilen angepasst werden. Sie können die Details der Stichwörter nach Bedarf anpassen, um Claude dazu zu bringen, mehr oder weniger detaillierte oder prägnante Inhalte zu generieren, mehr oder weniger Jargon einzubeziehen oder ein höheres oder niedrigeres Maß an kontextbezogener Zusammenfassung zu liefern.

Im Folgenden wird anhand eines Beispiels gezeigt, wie ein Stichwort erstellt wird, um sicherzustellen, dass die bei der Analyse eines Untermietvertrags erstellten Zusammenfassungen einer einheitlichen Struktur folgen:

import anthropic

# 初始化 Anthropic 客户端
client = anthropic.Anthropic()

def summarize_document(text, details_to_extract, model="claude-3-5-sonnet-20240620", max_tokens=1000):

    # 将要提取的细节格式化为提示词上下文的一部分
    details_to_extract_str = '\n'.join(details_to_extract)

    # 提示模型总结转租协议
    prompt = f"""Summarize the following sublease agreement. Focus on these key aspects:

    {details_to_extract_str}

    Provide the summary in bullet points nested within the XML header for each section. For example:

    <parties involved>
    - Sublessor: [Name]
    // 根据需要添加更多细节
    </parties involved>

    如果文档中没有明确说明某些信息,请标注为「未说明」。不要使用前言。

    转租协议内容:
    {text}
    """

    response = client.messages.create(
        model=model,
        max_tokens=max_tokens,
        system="You are a legal analyst specializing in real estate law, known for highly accurate and detailed summaries of sublease agreements.",
        messages=[
            {"role": "user", "content": prompt},
            {"role": "assistant", "content": "Here is the summary of the sublease agreement: <summary>"}
        ],
        stop_sequences=["</summary>"]
    )

    return response.content[0].text

sublease_summary = summarize_document(document_text, details_to_extract)
print(sublease_summary)

Dieser Code implementiert eine summarize_document Funktion, die Claude verwendet, um den Inhalt eines Untermietvertrags zusammenzufassen. Die Funktion nimmt als Eingabe einen Textstring und eine Liste von Details, die extrahiert werden sollen. In diesem Beispiel verwenden wir die document_text im Gesang antworten details_to_extract Variable ruft diese Funktion auf.

Innerhalb der Funktion wird für Claude ein Stichwort generiert, das das zusammenzufassende Dokument, die zu extrahierenden Details und spezifische Anweisungen für die Zusammenfassung des Dokuments enthält. Die Eingabeaufforderung weist Claude an, eine Zusammenfassung jedes extrahierten Details als verschachteltes XML-Tag zurückzugeben.

Da wir beschlossen haben, jeden Teil der Zusammenfassung innerhalb eines Tags auszugeben, können wir jeden Teil in einem Nachbearbeitungsschritt leicht analysieren. Dieser Ansatz erzeugt strukturierte Zusammenfassungen, passt sich an Ihr Nutzungsszenario an und stellt sicher, dass jede Zusammenfassung demselben Muster folgt.

Bewerten Sie Ihre Stichwörter

Stichwortwörter müssen in der Regel erst getestet und optimiert werden, bevor sie in der Produktion eingesetzt werden können. Um festzustellen, ob Ihre Lösung bereit ist, verwenden Sie einen systematischen Prozess, der quantitative und qualitative Methoden kombiniert, um die Qualität der Zusammenfassungen zu bewerten. Erstellen Sie Erfolgskriterien auf der Grundlage definierterStarke empirische Bewertunghilft Ihnen bei der Optimierung der Aufforderungswörter. Im Folgenden finden Sie einige Kennzahlen, die Sie in Ihre Bewertung einbeziehen sollten:

ROUGE-Punktzahl

BLEU-Punktzahl

Ähnlichkeit der Kontexteinbettung

LLM-basiertes Scoring

manuelle Bewertung

Tipps für den Einsatz

Beachten Sie die folgenden Punkte, wenn Sie Ihre Lösung in einer Produktionsumgebung einsetzen.

  1. Stellen Sie sicher, dass kein Haftungsrisiko besteht: Machen Sie sich mit den möglichen rechtlichen Folgen von Fehlern in den Zusammenfassungen vertraut, die zu einer rechtlichen Haftung für Ihr Unternehmen oder Ihre Kunden führen könnten. Geben Sie einen Haftungsausschluss oder eine rechtliche Erklärung ab, dass die Zusammenfassung durch KI erstellt wurde und von einem Juristen überprüft werden muss.
  2. Verarbeitet mehrere Dokumenttypen: In diesem Leitfaden wird beschrieben, wie man Text aus PDF-Dateien extrahiert. In der Praxis können die Dokumente in verschiedenen Formaten vorliegen (PDF, Word-Dokumente, Textdateien usw.). Stellen Sie sicher, dass Ihr Datenextraktionsprozess alle Dateiformate konvertiert, die Sie möglicherweise erhalten.
  3. Parallele Aufrufe der API von Claude: Bei langen Dokumenten, die eine große Anzahl von Token enthalten, kann es bis zu einer Minute dauern, bis Claude einen Digest erstellt. Bei großen Dokumentensammlungen müssen Sie möglicherweise parallel API-Aufrufe an Claude senden, um sicherzustellen, dass die Zusammenfassungen in einer angemessenen Zeitspanne abgeschlossen werden. Siehe Anthropics Tempolimit um die maximale Anzahl von API-Aufrufen zu bestimmen, die parallel ausgeführt werden können.

Leistung verbessern

In komplexen Szenarien wird zusätzlich zu den Standard Tipps für die Technik Darüber hinaus kann es von Vorteil sein, einige zusätzliche Strategien zur Verbesserung der Leistung in Betracht zu ziehen. Hier sind einige fortgeschrittene Strategien:

Exekutiv-Meta-Zusammenfassungen zum Zusammenfassen langer Dokumente

Bei juristischen Zusammenfassungen müssen oft lange Dokumente oder mehrere zusammenhängende Dokumente verarbeitet werden, die möglicherweise außerhalb des Kontextfensters von Claude liegen. Um diese Situation zu bewältigen, können Sie eine Chunking-Methode namens Meta-Digesting verwenden. Bei dieser Technik werden die Dokumente in kleinere, überschaubare Teile aufgeteilt und dann einzeln verarbeitet. Anschließend können Sie die Zusammenfassungen der einzelnen Chunks kombinieren, um eine Meta-Zusammenfassung des gesamten Dokuments zu erstellen.

Das folgende Beispiel zeigt, wie ein Meta-Zwischenergebnis erstellt werden kann:

import anthropic

# 初始化 Anthropic 客户端
client = anthropic.Anthropic()

def chunk_text(text, chunk_size=20000):
    return [text[i:i+chunk_size] for i in range(0, len(text), chunk_size)]

def summarize_long_document(text, details_to_extract, model="claude-3-5-sonnet-20240620", max_tokens=1000):

    # 格式化提取细节以放置在提示的上下文中
    details_to_extract_str = '\n'.join(details_to_extract)

    # 遍历块并分别对每个块进行摘要
    chunk_summaries = [summarize_document(chunk, details_to_extract, model=model, max_tokens=max_tokens) for chunk in chunk_text(text)]

    final_summary_prompt = f"""

    你正在查看多个相关文档的分块摘要。
    将以下来自不同可信来源的文档摘要整合成连贯的整体摘要:

    <chunked_summaries>
    {"".join(chunk_summaries)}
    </chunked_summaries>

    重点关注以下关键方面:
    {details_to_extract_str})

    将摘要以嵌套在每个部分的 XML 标头下的项目符号点的形式提供。例如:

    <parties involved>
    - 转租方:[姓名]
    // 根据需要添加更多细节
    </parties involved>

    如果文档中未明确说明任何信息,请注明「未指定」。不要加入前言。
    """

    response = client.messages.create(
        model=model,
        max_tokens=max_tokens,
        system="你是一名总结文档笔记的法律专家。",
        messages=[
            {"role": "user",  "content": final_summary_prompt},
            {"role": "assistant", "content": "以下是转租协议的摘要:<summary>"}

        ],
        stop_sequences=["</summary>"]
    )

    return response.content[0].text

long_summary = summarize_long_document(document_text, details_to_extract)
print(long_summary)

summarize_long_document Funktion basiert auf der vorherigen summarize_document Funktion, die das Dokument in kleinere Abschnitte aufteilt und jeden Abschnitt separat zusammenfasst.

Der Code tut dies, indem er die summarize_document Zu diesem Zweck wird die Funktion auf jeden 20.000-Zeichen-Block des Originaldokuments angewendet. Die Zusammenfassungen der einzelnen Blöcke werden dann zu einer endgültigen Zusammenfassung kombiniert, die sich aus diesen Blockzusammenfassungen zusammensetzt.

Beachten Sie, dass in unserem Beispiel-PDF diesummarize_long_document Funktion ist nicht unbedingt erforderlich, da das gesamte Dokument in das Kontextfenster von Claude passt. Dieser Ansatz ist jedoch kritisch, wenn das Dokument das Kontextfenster von Claude überschreitet oder wenn mehrere zusammenhängende Dokumente zusammengefasst werden müssen. In jedem Fall kann diese Meta-Zusammenfassungstechnik in der endgültigen Zusammenfassung oft mehr wichtige Details erfassen, die bei früheren Einzel-Zusammenfassungsmethoden übersehen wurden.

Durchsuchen einer großen Anzahl von Dokumenten mit Hilfe von indizierten Zusammenfassungen

Das Durchsuchen von Dokumentensammlungen mit Hilfe von Large Language Models (LLMs) beinhaltet normalerweise Retrieval Augmentation Generation (RAG). In Szenarien, die große Dokumente umfassen oder in denen eine präzise Informationssuche von entscheidender Bedeutung ist, ist die grundlegende RAG Methode unzureichend sein kann. Summary Indexed Documents ist eine fortschrittliche RAG-Methode, die eine effizientere Methode zur Einstufung von Dokumenten für das Retrieval bietet und weniger Kontext verwendet als herkömmliche RAG-Methoden. Bei diesem Ansatz wird Claude verwendet, um zunächst eine kurze Zusammenfassung für jedes Dokument im Korpus zu erstellen, und dann wird Clade verwendet, um die Relevanz jeder Zusammenfassung für die Abfrage zu bewerten. Weitere Einzelheiten zu diesem Ansatz, einschließlich eines codebasierten Beispiels, finden Sie in der Zusammenfassungskochbuch Der Abschnitt des zusammenfassenden Indexdokuments in der

Feinabstimmung von Claude zum Lernen Ihres Datensatzes

Eine weitere fortschrittliche Technik zur Verbesserung der Fähigkeit von Claude, Zusammenfassungen zu erstellen, ist die Feinabstimmung. Bei der Feinabstimmung wird Claude mit einem benutzerdefinierten Datensatz trainiert, der in hohem Maße auf Ihre Bedürfnisse bei der Erstellung von Zusammenfassungen im Bereich Recht abgestimmt ist, um sicherzustellen, dass es sich an Ihr Nutzungsszenario anpasst. Im Folgenden finden Sie einen Überblick über die Durchführung der Feinabstimmung:

  1. Verwechslung: Beginnen Sie damit, Beispiele für Claude-Zusammenfassungen zu sammeln, die den Anforderungen nicht genügen - dies kann bedeuten, dass wichtige rechtliche Details ausgelassen, der Kontext falsch verstanden oder eine unangemessene juristische Terminologie verwendet wird.
  2. Vorbereitung von Datensätzen: Sobald diese Probleme identifiziert sind, stellen Sie einen Datensatz mit Beispielen für diese Probleme zusammen. Dieser Datensatz sollte sowohl die ursprünglichen Rechtsdokumente als auch die von Ihnen korrigierten Zusammenfassungen enthalten, um sicherzustellen, dass Claude die gewünschten Verhaltensweisen erlernt.
  3. Durchführung der Feinabstimmung: Bei der Feinabstimmung wird das Modell anhand des von Ihnen zusammengestellten Datensatzes neu trainiert, um seine Gewichte und Parameter anzupassen. Diese Nachschulung hilft Claude, die spezifischen Anforderungen Ihres Rechtsgebiets besser zu verstehen, und verbessert seine Fähigkeit, Dokumente nach Ihren Kriterien zusammenzufassen.
  4. Iterative Verbesserung: Die Feinabstimmung ist kein einmaliger Prozess. Während Claude weiterhin Zusammenfassungen generiert, können Sie iterativ neue Beispiele mit unterdurchschnittlicher Leistung hinzufügen, um seine Fähigkeiten weiter zu verfeinern. Im Laufe der Zeit wird diese kontinuierliche Rückkopplungsschleife ein hochspezialisiertes Modell hervorbringen, das auf Ihre Aufgabe der juristischen Zusammenfassungen zugeschnitten ist.

Fine Tuning ist derzeit nur über Amazon Bedrock erhältlich. Für mehr Details, siehe AWS-Veröffentlichungs-Blog.

Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Claude's Guide to Common Use Cases: Juristische Schriftsätze
de_DEDeutsch