AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel

ColiVara: Auf visueller Einbettung basierender Dokumentenspeicher- und Retrievaldienst

Allgemeine Einführung

ColiVara ist ein Dokumentenspeicher- und -abrufdienst, der auf der Technologie der visuellen Einbettung basiert. ColiVara unterstützt mehr als 100 Dateiformate, darunter PDF, DOCX, PPTX usw., und ist in der Lage, Screenshots von Webseiten automatisch abzufangen und zu indizieren. ColiVara ermöglicht es Ihnen, Dokumente, die reich an visuellen Informationen sind, effizient zu speichern und abzurufen, was die Dokumentenverwaltung und das Abrufen von Informationen verbessert. coliVara bietet APIs und SDKs für Python und TypeScript, wodurch Sie keine Vektordatenbanken mehr verwalten müssen (pgVector läuft im Hintergrund). Darüber hinaus bietet ColiVara eine ausführliche Dokumentation und nahtlose lokale oder Cloud-basierte Schnellstartanleitungen, die eine post-interaktive Einbettungstechnologie zur Verbesserung der Genauigkeit nutzen. Und das Beste ist, dass ColiVara vollständig Open Source ist.

ColiVara: Auf visueller Einbettung basierender Dokumentenspeicher- und Retrievaldienst-1


 

Funktionsliste

  • Dokumentenspeicherung: Unterstützt das Hochladen und Speichern von Dokumenten in verschiedenen Dateiformaten.
  • Dokumentensuche: Effiziente Dokumentensuche und -abfrage auf der Grundlage der visuellen Einbettungstechnologie.
  • Auto-Screenshot: Macht automatisch Screenshots von Webseiten und indexiert sie.
  • Metadatenverwaltung: Unterstützung für das Hinzufügen von Metadaten zu Dokumenten für eine einfache Klassifizierung und Abfrage.
  • API-Schnittstelle: Bietet Python- und TypeScript-SDKs für die einfache Integration und Nutzung durch Entwickler.
  • Sammlungsmanagement: Unterstützt die Verwaltung von Dokumenten in Sammlungen zur einfachen Organisation und Klassifizierung.
  • Multimodale Suche: Unterstützt die modernste multimodale Suchfunktion.
  • Keine Verwaltung der Vektordatenbank erforderlich: pgVector läuft im Hintergrund und der Benutzer muss die Vektordatenbank nicht verwalten.
  • Open Source: ColiVara ist vollständig quelloffen und kann von den Nutzern frei verwendet und verändert werden.

 

Hilfe verwenden

Installation und Konfiguration

  1. Erhalten Sie einen API-Schlüssel: Besuchen Sie die ColiVara-Website, um sich anzumelden und einen kostenlosen API-Schlüssel zu erhalten.
  2. Installieren Sie das SDK:
    • Python:pip install colivara-py
    • TypeScript:npm install colivara-ts
  3. Konfigurieren Sie den Client:
   from colivara_py import ColiVara
client = ColiVara(api_key='你的API Key')

Dokument hochladen

  1. Laden Sie das Dokument hoch:
   document = client.upsert_document(
name="sample_document",
document_url="https://example.com/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)
  1. Laden Sie den Dateipfad oder die Base64-kodierte Datei hoch:
   document = client.upsert_document(
name="sample_document",
document_path="/path/to/sample.pdf",
metadata={"author": "John Doe"},
collection_name="user_1_collection",
wait=True
)

Dokumentensuche

  1. Einfache Suche:
   results = client.search("what is 1+1?")
  1. Suche nach Sammlungsnamen:
   results = client.search("what is 1+1?", collection_name="user_1_collection")
  1. Suche nach Metadaten filtern:
   results = client.search(
"what is 1+1?",
query_filter={"on": "document", "key": "author", "value": "John Doe", "lookup": "key_lookup"}
)

Verwaltung von Sammlungen

  1. Sammlungen erstellen:
   collection = client.create_collection(name="user_1_collection")
  1. Abrufen der Liste der Sammlungen:
   collections = client.list_collections()

API-Referenz

  • Dokument hochladen:upsert_document(name, document_url, metadata, collection_name, wait)
  • Dokumentenabruf:search(query, collection_name, query_filter)
  • Gepoolte Verwaltung:create_collection(name), list_collections()
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " ColiVara: Auf visueller Einbettung basierender Dokumentenspeicher- und Retrievaldienst
de_DEDeutsch