はじめに
LlamaParseは、PDF、PowerPoint、Word文書、スプレッドシートなどの複雑な文書を処理し、構造化データに変換できる強力な文書解析ツールです。LlamaParseは、スタンドアロンのREST API、Pythonパッケージ、TypeScript SDK、Web UIなど、さまざまな方法で利用できます。LlamaParseは自然言語コマンドを使用してドキュメントを解析し、複数の言語でのOCRをサポートしているため、幅広い業界やアプリケーションで効率的な解析とカスタマイズされた出力を提供します。
機能一覧
- ドキュメントの解析:PDF、PowerPoint、Wordドキュメント、スプレッドシートの解析をサポート。
- OCR機能:多言語の光学式文字認識をサポート。
- 自然言語命令:自然言語命令によって文書内容を解析する。
- 複数の出力フォーマット:Markdown、プレーンテキスト、JSON、その他の出力フォーマットをサポート。
- API統合:あらゆるプログラミング言語と統合可能なREST APIを提供。
- マルチプラットフォーム対応:Pythonパッケージ、TypeScript SDK、Web UIが利用可能。
- カスタム構文解析:ユーザーの要求に応じて構文解析と出力をカスタマイズします。
ヘルプの使用
インストールと使用
LlamaParseは様々な使用方法を提供しているので、ユーザーは必要に応じて適切なインストール方法と使用方法を選択することができます。
ウェブUIの使用
- ラマパースのウェブサイトをご覧ください。
- OAuth2.0(Google、Github、Microsoft)または電子メールを使用してサインインします。
- ログインしたら、"Parse "ボタンをクリックする。
- 任意のPDFファイルをファイルアップロードボックスにドラッグ&ドロップするか、ファイルのURLを入力してください。
- ファイルがアップロードされたら、ページ下部の「パース」ボタンをクリックする。
- 解析結果はページの下部に表示され、Markdown、プレーンテキスト、JSON、その他のフォーマットをサポートする。
Pythonパッケージの使用
- LlamaParse Pythonパッケージをインストールします:
pip install llamaparse
- 使用例:
from llamaparse import LlamaParse
parser = LlamaParse(api_key='YOUR_API_KEY')
result = parser.parse(file_path='/path/to/your/file.pdf')
print(result)
REST APIを使う
- APIキーを取得する:
- LlamaParseのウェブサイトにログインしてください。
- ユーザー設定のAPIキーを取得する。
- 使用例:
curl -X 'POST' \
'https://api.cloud.llamaindex.ai/api/parsing/upload'
-H 'accept: application/json' ୧-͈ᴗ-͈.
-H 'Content-Type: multipart/form-data' ୧-͈ᴗ-͈.
-H 'Authorization: Bearer YOUR_API_KEY' \
--form 'file=@/path/to/your/file.pdf;type=application/pdf'
主な機能
文書解像度
- ドキュメントのアップロード:Web UI、Pythonパッケージ、またはREST APIを介して解析するドキュメントをアップロードします。
- 構文解析オプションの設定: OCR言語、構文解析命令、その他のオプションを設定できます。
- ドキュメントの解析:「解析」ボタンをクリックするか、解析関数を呼び出す。
- View Result(結果の表示):解析結果は指定されたフォーマットで出力され、Web UIで表示したり、APIを通じて取得したりすることができる。
OCR機能
- OCR言語の設定: 解析オプションで認識する言語を設定します。
- 画像を含む文書のアップロード:PDF、画像、その他の形式に対応しています。
- ドキュメントの解析:LlamaParseは画像中のテキストを自動的に認識し、解析します。
自然言語教育
- 構文解析指示の設定:構文解析オプションに、「レストランのレシートを構文解析し、合計金額とチップを抽出する」など、自然言語による指示を入力します。
- ドキュメントのアップロード:PDF、Word、その他のフォーマットに対応。
- ドキュメントの解析: LlamaParseはコマンドに従ってドキュメントの内容を解析し、結果を出力します。
カスタム・パース
- カスタム解析オプションの設定:OCRを無効にするかどうか、斜めのテキストをスキップするかどうか、その他のオプションを設定できます。
- ドキュメントのアップロード:様々な形式のドキュメントのアップロードに対応。
- ドキュメントの解析:カスタムオプションに従って解析し、要件を満たす結果を出力します。
LlamaParseは豊富な機能と柔軟な使い方を提供し、ユーザーは必要に応じて適切な構文解析方法を選択し、カスタマイズオプションで構文解析をパーソナライズすることができます。企業ユーザーでも個人ユーザーでも、LlamaParseは文書処理プロセスを簡素化し、作業効率を向上させることができます。