ColiVara : Service de stockage et de recherche de documents basé sur l'intégration visuelle

Introduction générale

ColiVara est un service de stockage et de récupération de documents basé sur la technologie de l'intégration visuelle. ColiVara prend en charge plus de 100 formats de fichiers, notamment PDF, DOCX, PPTX, etc. et est capable d'intercepter et d'indexer automatiquement des captures d'écran de pages web. ColiVara vous permet de stocker et de récupérer efficacement des documents riches en informations visuelles, améliorant ainsi la gestion des documents et la recherche d'informations. coliVara fournit des API et des SDK pour Python et TypeScript, de sorte que vous n'avez pas besoin de gérer des bases de données vectorielles (pgVector s'exécute en arrière-plan). En outre, ColiVara fournit une documentation détaillée et des guides de démarrage rapide transparents, locaux ou basés sur le cloud, en utilisant la technologie d'intégration post-interactive pour améliorer la précision. Enfin, ColiVara est entièrement open source.

ColiVara:基于视觉嵌入的文档存储与检索服务

 

Liste des fonctions

  • Stockage de documents : permet de télécharger et de stocker des documents dans plusieurs formats de fichiers.
  • Recherche de documents : recherche et récupération efficaces de documents basées sur la technologie de l'intégration visuelle.
  • Capture d'écran automatique : prend automatiquement des captures d'écran des pages web et les indexe.
  • Gestion des métadonnées : possibilité d'ajouter des métadonnées aux documents pour en faciliter le classement et la recherche.
  • Interface API : fournit des SDK Python et TypeScript pour faciliter l'intégration et l'utilisation par les développeurs.
  • Gestion des collections : permet de gérer les documents par collection pour faciliter l'organisation et la classification.
  • Recherche multimodale : prend en charge la fonction de recherche multimodale la plus avancée.
  • Aucune gestion de la base de données vectorielle n'est nécessaire : pgVector fonctionne en arrière-plan et l'utilisateur n'a pas besoin de gérer la base de données vectorielle.
  • Open Source : ColiVara est entièrement open source et les utilisateurs sont libres de l'utiliser et de le modifier.

 

Utiliser l'aide

Installation et configuration

  1. Obtenir une clé API : visitez le site Web de ColiVara pour vous inscrire et obtenir une clé API gratuite.
  2. Installer le SDK :
    • Python :pip install colivara-py
    • TypeScript :npm install colivara-ts
  3. Configurer le client :
   from colivara_py import ColiVara
client = ColiVara(api_key='你的API Key')

Téléchargement de documents

  1. Télécharger le document :
   document = client.upsert_document(
name="sample_document",
document_url="https://example.com/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
  1. Téléchargez le chemin d'accès au fichier ou le fichier encodé en Base64 :
   document = client.upsert_document(
name="sample_document",
document_path="/path/to/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)

recherche de documents

  1. Recherche simple :
   results = client.search("what is 1+1?")
  1. Recherche par nom de collection :
   results = client.search("what is 1+1?", collection_name="user_1_collection")
  1. Filtrer la recherche par métadonnées :
   results = client.search(
"what is 1+1?",
query_filter={"on": "document", "key": "author", "value": "John Doe", "lookup": "key_lookup"}
)

Gestion des collections

  1. Création de collections :
   collection = client.create_collection(name="user_1_collection")
  1. Obtenir la liste des collections :
   collections = client.list_collections()

Référence API

  • Téléchargement de documents :upsert_document(name, document_url, metadata, collection_name, wait)
  • Recherche de documents :search(query, collection_name, query_filter)
  • Gestion commune :create_collection(name), list_collections()
© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...