ColiVara: сервис хранения и поиска документов на основе визуального встраивания
Общее введение
ColiVara - это сервис хранения и поиска документов, основанный на технологии визуального встраивания. ColiVara поддерживает более 100 форматов файлов, включая PDF, DOCX, PPTX и т. д., а также способна автоматически перехватывать и индексировать скриншоты веб-страниц. ColiVara позволяет эффективно хранить и извлекать документы, богатые визуальной информацией, улучшая управление документами и поиск информации. coliVara предоставляет API и SDK для Python и TypeScript, поэтому вам не нужно управлять векторными базами данных (pgVector работает в фоновом режиме). Кроме того, ColiVara предоставляет подробную документацию и удобные локальные или облачные руководства по быстрому запуску, используя технологию пост-интерактивного встраивания для повышения точности. Самое главное - ColiVara имеет полностью открытый исходный код.

Список функций
- Хранение документов: поддержка загрузки и хранения документов в различных форматах.
- Поиск документов: эффективный поиск и извлечение документов на основе технологии визуального встраивания.
- Auto Screenshot: автоматическое создание скриншотов веб-страниц и их индексация.
- Управление метаданными: поддержка добавления метаданных к документам для упрощения их классификации и поиска.
- API-интерфейс: предоставляет SDK для Python и TypeScript для простой интеграции и использования разработчиками.
- Управление коллекциями: поддержка управления документами по коллекциям для удобной организации и классификации.
- Мультимодальный поиск: поддерживает самую передовую функцию мультимодального поиска.
- Управление базой данных векторов не требуется: pgVector работает в фоновом режиме, и пользователю не нужно управлять базой данных векторов.
- Открытый исходный код: ColiVara - это полностью открытый исходный код, и пользователи могут свободно использовать и модифицировать его.
Использование помощи
Установка и настройка
- Получите ключ API: посетите сайт ColiVara, чтобы зарегистрироваться и получить бесплатный ключ API.
- Установите SDK:
- Питон:
pip install colivara-py
- TypeScript:
npm install colivara-ts
- Питон:
- Настройте клиента:
from colivara_py import ColiVara
client = ColiVara(api_key='你的API Key')
Загрузка документов
- Загрузите документ:
document = client.upsert_document(
name="sample_document",
document_url="https://example.com/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
- Загрузите путь к файлу или файл в кодировке Base64:
document = client.upsert_document(
name="sample_document",
document_path="/path/to/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
поиск документов
- Простой поиск:
results = client.search("what is 1+1?")
- Поиск по названию коллекции:
results = client.search("what is 1+1?", collection_name="user_1_collection")
- Фильтруйте поиск по метаданным:
results = client.search(
"what is 1+1?",
query_filter={"on": "document", "key": "author", "value": "John Doe", "lookup": "key_lookup"}
)
Управление коллекциями
- Создание коллекций:
collection = client.create_collection(name="user_1_collection")
- Получите список коллекций:
collections = client.list_collections()
Справочник по API
- Загрузка документов:
upsert_document(name, document_url, metadata, collection_name, wait)
- Поиск документов:
search(query, collection_name, query_filter)
- Совместное управление:
create_collection(name)
,list_collections()
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...