Allgemeine Einführung
LlamaParse ist ein leistungsfähiges Dokument-Parsing-Tool, das komplexe Dokumente wie PDF-, PowerPoint-, Word-Dokumente und Tabellenkalkulationen verarbeiten und in strukturierte Daten umwandeln kann. LlamaParse ist auf verschiedene Arten verfügbar, darunter eine eigenständige REST-API, Python-Pakete, ein TypeScript-SDK und eine Web-UI. LlamaParse analysiert Dokumente mithilfe von Befehlen in natürlicher Sprache und unterstützt OCR in mehreren Sprachen, um effizientes Parsing und maßgeschneiderte Ausgaben für eine Vielzahl von Branchen und Anwendungen zu ermöglichen.
Funktionsliste
- Parsing von Dokumenten: Unterstützung für PDF-, PowerPoint- und Word-Dokumente sowie für Tabellenkalkulationen.
- OCR-Funktion: Unterstützt die optische Zeichenerkennung in mehreren Sprachen.
- Anweisungen in natürlicher Sprache: Analysiert den Inhalt von Dokumenten anhand von Anweisungen in natürlicher Sprache.
- Mehrere Ausgabeformate: Unterstützt Markdown, einfachen Text, JSON und andere Ausgabeformate.
- API-Integration: Bietet eine REST-API, die mit jeder Programmiersprache integriert werden kann.
- Multiplattform-Unterstützung: Python-Pakete, TypeScript SDK und Web UI sind verfügbar.
- Benutzerdefiniertes Parsing: Anpassung von Parsing und Ausgabe an die Anforderungen des Benutzers.
Hilfe verwenden
Installation und Nutzung
LlamaParse bietet eine Vielzahl von Verwendungsmöglichkeiten, so dass der Benutzer je nach seinen Bedürfnissen die passende Art der Installation und Verwendung wählen kann.
Verwendung der Web-UI
- Besuchen Sie die LlamaParse-Website.
- Melden Sie sich mit OAuth 2.0 (Google, Github, Microsoft) oder per E-Mail an.
- Wenn Sie angemeldet sind, klicken Sie auf die Schaltfläche "Parse".
- Ziehen Sie eine beliebige PDF-Datei in das Feld Datei-Upload, oder geben Sie die URL der Datei an.
- Sobald die Datei hochgeladen ist, klicken Sie unten auf der Seite auf die Schaltfläche "Parse".
- Das Parsing-Ergebnis wird unten auf der Seite angezeigt und unterstützt Markdown, einfachen Text, JSON und andere Formate.
Verwendung von Python-Paketen
- Installieren Sie das LlamaParse Python-Paket:
pip install llamaparse
- Beispiel für die Verwendung:
from llamaparse import LlamaParse
parser = LlamaParse(api_key='YOUR_API_KEY')
ergebnis = parser.parse(dateipfad='/pfad/zu/ihre/datei.pdf')
print(ergebnis)
Verwendung der REST-API
- Abrufen des API-Schlüssels:
- Melden Sie sich auf der LlamaParse-Website an.
- Rufen Sie den API-Schlüssel in den Benutzereinstellungen ab.
- Beispiel für die Verwendung:
curl -X 'POST' \
'https://api.cloud.llamaindex.ai/api/parsing/upload' \
-H 'accept: application/json' \
-H 'Content-Type: multipart/form-data' \\
-H 'Authorization: Bearer YOUR_API_KEY' \\
--form 'file=@/path/to/your/file.pdf;type=application/pdf'
Hauptfunktionen
Dokumentenauflösung
- Hochladen von Dokumenten: Laden Sie Dokumente hoch, die über die Web-UI, Python-Pakete oder die REST-API geparst werden sollen.
- Parsing-Optionen einstellen: Sie können die OCR-Sprache, Parsing-Anweisungen und andere Optionen einstellen.
- Parsen des Dokuments: Klicken Sie auf die Schaltfläche "Parsen" oder rufen Sie die Parse-Funktion auf.
- Ergebnis anzeigen: Das Parsing-Ergebnis wird in dem angegebenen Format ausgegeben, das in der Web-UI angezeigt oder über die API abgerufen werden kann.
OCR-Funktionen
- OCR-Sprache festlegen: Legen Sie die Sprache fest, die in den Parsing-Optionen erkannt werden soll.
- Hochladen von Dokumenten mit Bildern: PDF, Bilder und andere Formate werden unterstützt.
- Parsing von Dokumenten: LlamaParse erkennt automatisch Text in Bildern und parst ihn.
Unterricht in natürlicher Sprache
- Parsing-Anweisungen einrichten: Geben Sie in den Parsing-Optionen eine Anweisung in natürlicher Sprache ein, z. B. "Parsing von Restaurantquittungen, Extraktion von Gesamtbetrag und Trinkgeld".
- Hochladen von Dokumenten: Unterstützung von PDF, Word und anderen Formaten.
- Parsen eines Dokuments: LlamaParse parst den Inhalt des Dokuments entsprechend dem Befehl und gibt das Ergebnis aus.
Benutzerdefiniertes Parsing
- Einstellen von benutzerdefinierten Parsing-Optionen: Sie können festlegen, ob OCR deaktiviert, diagonaler Text übersprungen und andere Optionen verwendet werden sollen.
- Hochladen von Dokumenten: Unterstützt das Hochladen von Dokumenten in einer Vielzahl von Formaten.
- Parsing Documents: Parsing nach benutzerdefinierten Optionen und Ausgabe von Ergebnissen, die den Anforderungen entsprechen.
LlamaParse bietet eine reichhaltige Funktionalität und eine flexible Nutzung, die es dem Benutzer ermöglicht, die richtige Parsing-Methode für seine Bedürfnisse zu wählen und das Parsing mit Anpassungsoptionen zu personalisieren. Egal, ob Sie ein Unternehmen oder ein Einzelanwender sind, LlamaParse kann Ihnen helfen, den Prozess der Dokumentenverarbeitung zu vereinfachen und die Arbeitseffizienz zu verbessern.