ColiVara: servicio de almacenamiento y recuperación de documentos basado en incrustación visual
Últimos recursos sobre IAPublicado hace 6 meses Círculo de intercambio de inteligencia artificial 3K 00
Introducción general
ColiVara es un servicio de almacenamiento y recuperación de documentos basado en la tecnología de incrustación visual. Elimina la necesidad de reconocimiento óptico de caracteres (OCR) o de extracción de texto y evita el problema de los formularios rotos o las imágenes perdidas.ColiVara admite más de 100 formatos de archivo, incluidos PDF, DOCX, PPTX, etc., y es capaz de interceptar e indexar automáticamente capturas de pantalla de páginas web. ColiVara permite almacenar y recuperar eficazmente documentos ricos en información visual, mejorando la gestión de documentos y la recuperación de información. coliVara proporciona API y SDK para Python y TypeScript, por lo que no es necesario gestionar bases de datos vectoriales (pgVector se ejecuta en segundo plano). Además, ColiVara proporciona documentación detallada y guías de inicio rápido locales o basadas en la nube sin problemas, utilizando tecnología de incrustación post-interactiva para mejorar la precisión. Lo mejor de todo es que ColiVara es completamente de código abierto.

Lista de funciones
- Almacenamiento de documentos: permite cargar y almacenar documentos en varios formatos de archivo.
- Recuperación de documentos: búsqueda y recuperación eficaz de documentos basada en la tecnología de incrustación visual.
- Captura de pantalla automática: Realiza automáticamente capturas de pantalla de páginas web y las indexa.
- Gestión de metadatos: permite añadir metadatos a los documentos para facilitar su clasificación y recuperación.
- Interfaz API: proporciona SDK de Python y TypeScript para facilitar la integración y el uso por parte de los desarrolladores.
- Gestión de colecciones: admite la gestión de documentos por colecciones para facilitar su organización y clasificación.
- Búsqueda multimodal: Admite la función de búsqueda multimodal más avanzada.
- No requiere gestión de la base de datos de vectores: pgVector se ejecuta en segundo plano y el usuario no necesita gestionar la base de datos de vectores.
- Código abierto: ColiVara es completamente de código abierto y los usuarios son libres de utilizarlo y modificarlo.
Utilizar la ayuda
Instalación y configuración
- Obtenga una clave API: Visite el sitio web de ColiVara para registrarse y obtener una clave API gratuita.
- Instale el SDK:
- Python:
pip install colivara-py
- TypeScript:
npm install colivara-ts
- Python:
- Configura el cliente:
from colivara_py import ColiVara
client = ColiVara(api_key='你的API Key')
Carga de documentos
- Sube el documento:
document = client.upsert_document(
name="sample_document",
document_url="https://example.com/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
- Cargue la ruta del archivo o el archivo codificado en Base64:
document = client.upsert_document(
name="sample_document",
document_path="/path/to/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
búsqueda de documentos
- Búsqueda simple:
results = client.search("what is 1+1?")
- Búsqueda por nombre de colección:
results = client.search("what is 1+1?", collection_name="user_1_collection")
- Filtrar la búsqueda por metadatos:
results = client.search(
"what is 1+1?",
query_filter={"on": "document", "key": "author", "value": "John Doe", "lookup": "key_lookup"}
)
Gestión de colecciones
- Creación de colecciones:
collection = client.create_collection(name="user_1_collection")
- Obtener la lista de colecciones:
collections = client.list_collections()
Referencia API
- Carga de documentos:
upsert_document(name, document_url, metadata, collection_name, wait)
- Recuperación de documentos:
search(query, collection_name, query_filter)
- Gestión mancomunada:
create_collection(name)
,list_collections()
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...