ColiVara: servicio de almacenamiento y recuperación de documentos basado en incrustación visual

Introducción general

ColiVara es un servicio de almacenamiento y recuperación de documentos basado en la tecnología de incrustación visual. Elimina la necesidad de reconocimiento óptico de caracteres (OCR) o de extracción de texto y evita el problema de los formularios rotos o las imágenes perdidas.ColiVara admite más de 100 formatos de archivo, incluidos PDF, DOCX, PPTX, etc., y es capaz de interceptar e indexar automáticamente capturas de pantalla de páginas web. ColiVara permite almacenar y recuperar eficazmente documentos ricos en información visual, mejorando la gestión de documentos y la recuperación de información. coliVara proporciona API y SDK para Python y TypeScript, por lo que no es necesario gestionar bases de datos vectoriales (pgVector se ejecuta en segundo plano). Además, ColiVara proporciona documentación detallada y guías de inicio rápido locales o basadas en la nube sin problemas, utilizando tecnología de incrustación post-interactiva para mejorar la precisión. Lo mejor de todo es que ColiVara es completamente de código abierto.

ColiVara:基于视觉嵌入的文档存储与检索服务

 

Lista de funciones

  • Almacenamiento de documentos: permite cargar y almacenar documentos en varios formatos de archivo.
  • Recuperación de documentos: búsqueda y recuperación eficaz de documentos basada en la tecnología de incrustación visual.
  • Captura de pantalla automática: Realiza automáticamente capturas de pantalla de páginas web y las indexa.
  • Gestión de metadatos: permite añadir metadatos a los documentos para facilitar su clasificación y recuperación.
  • Interfaz API: proporciona SDK de Python y TypeScript para facilitar la integración y el uso por parte de los desarrolladores.
  • Gestión de colecciones: admite la gestión de documentos por colecciones para facilitar su organización y clasificación.
  • Búsqueda multimodal: Admite la función de búsqueda multimodal más avanzada.
  • No requiere gestión de la base de datos de vectores: pgVector se ejecuta en segundo plano y el usuario no necesita gestionar la base de datos de vectores.
  • Código abierto: ColiVara es completamente de código abierto y los usuarios son libres de utilizarlo y modificarlo.

 

Utilizar la ayuda

Instalación y configuración

  1. Obtenga una clave API: Visite el sitio web de ColiVara para registrarse y obtener una clave API gratuita.
  2. Instale el SDK:
    • Python:pip install colivara-py
    • TypeScript:npm install colivara-ts
  3. Configura el cliente:
   from colivara_py import ColiVara
client = ColiVara(api_key='你的API Key')

Carga de documentos

  1. Sube el documento:
   document = client.upsert_document(
name="sample_document",
document_url="https://example.com/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
  1. Cargue la ruta del archivo o el archivo codificado en Base64:
   document = client.upsert_document(
name="sample_document",
document_path="/path/to/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)

búsqueda de documentos

  1. Búsqueda simple:
   results = client.search("what is 1+1?")
  1. Búsqueda por nombre de colección:
   results = client.search("what is 1+1?", collection_name="user_1_collection")
  1. Filtrar la búsqueda por metadatos:
   results = client.search(
"what is 1+1?",
query_filter={"on": "document", "key": "author", "value": "John Doe", "lookup": "key_lookup"}
)

Gestión de colecciones

  1. Creación de colecciones:
   collection = client.create_collection(name="user_1_collection")
  1. Obtener la lista de colecciones:
   collections = client.list_collections()

Referencia API

  • Carga de documentos:upsert_document(name, document_url, metadata, collection_name, wait)
  • Recuperación de documentos:search(query, collection_name, query_filter)
  • Gestión mancomunada:create_collection(name), list_collections()
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...