LlamaParse: Llamaindex의 고품질 문서 구문 분석 및 데이터 추출 서비스(하루 1,000페이지 무료).
일반 소개
라마파스는 PDF, 파워포인트, 워드 문서, 스프레드시트 등 복잡한 문서를 처리하고 구조화된 데이터로 변환할 수 있는 강력한 문서 파싱 도구로, 독립형 REST API, Python 패키지, TypeScript SDK, 웹 UI 등 다양한 방식으로 이용할 수 있습니다. 자연어 명령을 사용하여 문서를 구문 분석하고 여러 언어의 OCR을 지원하여 다양한 산업과 애플리케이션에 효율적인 구문 분석과 맞춤형 출력을 제공합니다.

기능 목록
- 문서 구문 분석: PDF, PowerPoint, Word 문서 및 스프레드시트 구문 분석을 지원합니다.
- OCR 기능: 여러 언어의 광학 문자 인식을 지원합니다.
- 자연어 명령: 자연어 명령을 통해 문서 콘텐츠를 구문 분석합니다.
- 여러 출력 형식: 마크다운, 일반 텍스트, JSON 및 기타 출력 형식을 지원합니다.
- API 통합: 모든 프로그래밍 언어와 통합할 수 있는 REST API를 제공합니다.
- 멀티플랫폼 지원: Python 패키지, TypeScript SDK 및 웹 UI를 사용할 수 있습니다.
- 사용자 지정 구문 분석: 사용자 요구 사항에 따라 구문 분석 및 출력을 사용자 지정합니다.
도움말 사용
설치 및 사용
라마파스는 다양한 사용 방법을 제공하므로 사용자는 필요에 따라 적절한 설치 및 사용 방법을 선택할 수 있습니다.
웹 UI 사용
- 라마파스 웹사이트를 방문하세요.
- OAuth 2.0(Google, Github, Microsoft) 또는 이메일을 사용하여 로그인합니다.
- 로그인한 후 '분석' 버튼을 클릭합니다.
- 파일 업로드 상자에 PDF 파일을 끌어다 놓거나 파일 URL을 입력합니다.
- 파일이 업로드되면 페이지 하단의 '구문 분석' 버튼을 클릭합니다.
- 구문 분석 결과는 페이지 하단에 표시되며, 마크다운, 일반 텍스트, JSON 및 기타 형식을 지원합니다.
파이썬 패키지 사용
- 라마파스 파이썬 패키지를 설치합니다:
pip install llamaparse
- 사용 예시:
from llamaparse import LlamaParse
parser = LlamaParse(api_key='YOUR_API_KEY')
result = parser.parse(file_path='/path/to/your/file.pdf')
print(result)
REST API 사용
- API 키를 받습니다:
- 라마파스 웹사이트에 로그인합니다.
- 사용자 설정에서 API 키를 받습니다.
- 사용 예시:
curl -X 'POST' \
'https://api.cloud.llamaindex.ai/api/parsing/upload' \
-H 'accept: application/json' \
-H 'Content-Type: multipart/form-data' \
-H "Authorization: Bearer YOUR_API_KEY" \
--form 'file=@/path/to/your/file.pdf;type=application/pdf'
주요 기능
문서 해상도
- 문서 업로드: 웹 UI, Python 패키지 또는 REST API를 통해 구문 분석할 문서를 업로드합니다.
- 구문 분석 옵션 설정: OCR 언어, 구문 분석 지침 및 기타 옵션을 설정할 수 있습니다.
- 문서 구문 분석: '구문 분석' 버튼을 클릭하거나 구문 분석 함수를 호출합니다.
- 결과 보기: 구문 분석 결과가 지정된 형식으로 출력되며, 웹 UI에서 보거나 API를 통해 얻을 수 있습니다.
OCR 기능
- OCR 언어 설정: 구문 분석 옵션에서 인식할 언어를 설정합니다.
- 이미지가 포함된 문서 업로드: PDF, 이미지 및 기타 형식이 지원됩니다.
- 문서 구문 분석: LlamaParse는 이미지의 텍스트를 자동으로 인식하여 구문 분석합니다.
자연어 교육
- 구문 분석 지침 설정: 구문 분석 옵션에 "식당 영수증 구문 분석, 총 금액 및 팁 추출"과 같은 자연어 지침을 입력합니다.
- 문서 업로드: PDF, Word 및 기타 형식을 지원합니다.
- 문서 구문 분석: LlamaParse는 명령에 따라 문서의 내용을 구문 분석하고 결과를 출력합니다.
사용자 지정 구문 분석
- 사용자 지정 구문 분석 옵션 설정: OCR 비활성화, 대각선 텍스트 건너뛰기 및 기타 옵션의 사용 여부를 설정할 수 있습니다.
- 문서 업로드: 다양한 형식의 문서 업로드를 지원합니다.
- 문서 구문 분석: 사용자 지정 옵션에 따라 구문 분석하고 요구 사항을 충족하는 결과를 출력합니다.
LlamaParse는 풍부한 기능과 유연한 사용법을 제공하여 사용자가 필요에 따라 올바른 구문 분석 방법을 선택하고 사용자 지정 옵션으로 구문 분석을 개인화할 수 있습니다. 기업 사용자든 개인 사용자든 LlamaParse는 문서 처리 프로세스를 간소화하고 업무 효율성을 개선하는 데 도움을 줄 수 있습니다.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...