일반 소개
ColiVara는 비주얼 임베딩 기술을 기반으로 한 문서 저장 및 검색 서비스입니다. 광학 문자 인식(OCR)이나 텍스트 추출이 필요 없고, 양식의 깨짐이나 이미지 손실 문제를 방지하며, PDF, DOCX, PPTX 등 100개 이상의 파일 형식을 지원하고 웹 페이지 스크린샷을 자동으로 가로채 색인화할 수 있습니다. 시각적 정보가 풍부한 문서를 효율적으로 저장하고 검색할 수 있어 문서 관리 및 정보 검색을 개선할 수 있으며, Python 및 TypeScript용 API와 SDK를 제공하므로 벡터 데이터베이스를 관리할 필요가 없습니다(pgVector는 백그라운드에서 실행됨). 또한 ColiVara는 포스트 인터랙티브 임베딩 기술을 사용하여 정확성을 높이기 위해 상세한 문서와 원활한 로컬 또는 클라우드 기반 빠른 시작 가이드를 제공합니다. 무엇보다도 ColiVara는 완전한 오픈 소스입니다.

기능 목록
- 문서 저장소: 여러 파일 형식의 문서 업로드 및 저장을 지원합니다.
- 문서 검색: 시각적 임베딩 기술을 기반으로 효율적인 문서 검색 및 검색이 가능합니다.
- 자동 스크린샷: 웹 페이지의 스크린샷을 자동으로 찍고 색인을 생성합니다.
- 메타데이터 관리: 문서에 메타데이터를 추가하여 쉽게 분류하고 검색할 수 있도록 지원합니다.
- API 인터페이스: 개발자가 쉽게 통합하고 사용할 수 있도록 Python 및 TypeScript SDK를 제공합니다.
- 컬렉션 관리: 컬렉션별로 문서를 관리하여 쉽게 정리하고 분류할 수 있도록 지원합니다.
- 멀티모달 검색: 가장 진보된 멀티모달 검색 기능을 지원합니다.
- 벡터 데이터베이스 관리 불필요: pgVector는 백그라운드에서 실행되므로 사용자가 벡터 데이터베이스를 관리할 필요가 없습니다.
- 오픈 소스: ColiVara는 완전한 오픈 소스이며 사용자가 자유롭게 사용 및 수정할 수 있습니다.
도움말 사용
설치 및 구성
- API 키 받기: ColiVara 웹사이트를 방문하여 가입하고 무료 API 키를 받으세요.
- SDK를 설치합니다:
- Python:
pip install colivara-py
- TypeScript:
npm install colivara-ts
- Python:
- 클라이언트를 구성합니다:
from colivara_py import ColiVara
client = ColiVara(api_key='你的API Key')
문서 업로드
- 문서를 업로드합니다:
document = client.upsert_document(
name="sample_document",
document_url="https://example.com/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
- 파일 경로 또는 Base64로 인코딩된 파일을 업로드합니다:
document = client.upsert_document(
name="sample_document",
document_path="/path/to/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
문서 검색
- 간단한 검색:
results = client.search("what is 1+1?")
- 컬렉션 이름으로 검색합니다:
results = client.search("what is 1+1?", collection_name="user_1_collection")
- 메타데이터로 검색을 필터링합니다:
results = client.search(
"what is 1+1?",
query_filter={"on": "document", "key": "author", "value": "John Doe", "lookup": "key_lookup"}
)
컬렉션 관리
- 컬렉션 만들기:
collection = client.create_collection(name="user_1_collection")
- 컬렉션 목록을 가져옵니다:
collections = client.list_collections()
API 참조
- 문서 업로드:
upsert_document(name, document_url, metadata, collection_name, wait)
- 문서 검색:
search(query, collection_name, query_filter)
- 풀 관리:
create_collection(name)
,list_collections()
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...