ColiVara: сервис хранения и поиска документов на основе визуального встраивания

Общее введение

ColiVara - это сервис хранения и поиска документов, основанный на технологии визуального встраивания. ColiVara поддерживает более 100 форматов файлов, включая PDF, DOCX, PPTX и т. д., а также способна автоматически перехватывать и индексировать скриншоты веб-страниц. ColiVara позволяет эффективно хранить и извлекать документы, богатые визуальной информацией, улучшая управление документами и поиск информации. coliVara предоставляет API и SDK для Python и TypeScript, поэтому вам не нужно управлять векторными базами данных (pgVector работает в фоновом режиме). Кроме того, ColiVara предоставляет подробную документацию и удобные локальные или облачные руководства по быстрому запуску, используя технологию пост-интерактивного встраивания для повышения точности. Самое главное - ColiVara имеет полностью открытый исходный код.

ColiVara:基于视觉嵌入的文档存储与检索服务

 

Список функций

  • Хранение документов: поддержка загрузки и хранения документов в различных форматах.
  • Поиск документов: эффективный поиск и извлечение документов на основе технологии визуального встраивания.
  • Auto Screenshot: автоматическое создание скриншотов веб-страниц и их индексация.
  • Управление метаданными: поддержка добавления метаданных к документам для упрощения их классификации и поиска.
  • API-интерфейс: предоставляет SDK для Python и TypeScript для простой интеграции и использования разработчиками.
  • Управление коллекциями: поддержка управления документами по коллекциям для удобной организации и классификации.
  • Мультимодальный поиск: поддерживает самую передовую функцию мультимодального поиска.
  • Управление базой данных векторов не требуется: pgVector работает в фоновом режиме, и пользователю не нужно управлять базой данных векторов.
  • Открытый исходный код: ColiVara - это полностью открытый исходный код, и пользователи могут свободно использовать и модифицировать его.

 

Использование помощи

Установка и настройка

  1. Получите ключ API: посетите сайт ColiVara, чтобы зарегистрироваться и получить бесплатный ключ API.
  2. Установите SDK:
    • Питон:pip install colivara-py
    • TypeScript:npm install colivara-ts
  3. Настройте клиента:
   from colivara_py import ColiVara
client = ColiVara(api_key='你的API Key')

Загрузка документов

  1. Загрузите документ:
   document = client.upsert_document(
name="sample_document",
document_url="https://example.com/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
  1. Загрузите путь к файлу или файл в кодировке Base64:
   document = client.upsert_document(
name="sample_document",
document_path="/path/to/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)

поиск документов

  1. Простой поиск:
   results = client.search("what is 1+1?")
  1. Поиск по названию коллекции:
   results = client.search("what is 1+1?", collection_name="user_1_collection")
  1. Фильтруйте поиск по метаданным:
   results = client.search(
"what is 1+1?",
query_filter={"on": "document", "key": "author", "value": "John Doe", "lookup": "key_lookup"}
)

Управление коллекциями

  1. Создание коллекций:
   collection = client.create_collection(name="user_1_collection")
  1. Получите список коллекций:
   collections = client.list_collections()

Справочник по API

  • Загрузка документов:upsert_document(name, document_url, metadata, collection_name, wait)
  • Поиск документов:search(query, collection_name, query_filter)
  • Совместное управление:create_collection(name), list_collections()
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...