Allgemeine Einführung
ColiVara ist ein Dokumentenspeicher- und -abrufdienst, der auf der Technologie der visuellen Einbettung basiert. ColiVara unterstützt mehr als 100 Dateiformate, darunter PDF, DOCX, PPTX usw., und ist in der Lage, Screenshots von Webseiten automatisch abzufangen und zu indizieren. Mit ColiVara können Sie Dokumente, die reich an visuellen Informationen sind, effizient speichern und abrufen und so das Dokumentenmanagement und die Informationsbeschaffung verbessern. coliVara bietet APIs und SDKs für Python und TypeScript, so dass Sie keine Vektordatenbank verwalten müssen (pgVector läuft im Hintergrund). Darüber hinaus bietet ColiVara eine ausführliche Dokumentation und nahtlose lokale oder Cloud-basierte Schnellstartanleitungen, die eine post-interaktive Einbettungstechnologie zur Verbesserung der Genauigkeit nutzen. Und das Beste ist, dass ColiVara vollständig Open Source ist.
Funktionsliste
- Dokumentenspeicherung: Unterstützt das Hochladen und Speichern von Dokumenten in verschiedenen Dateiformaten.
- Dokumentensuche: Effiziente Dokumentensuche und -abfrage auf der Grundlage der visuellen Einbettungstechnologie.
- Auto-Screenshot: Macht automatisch Screenshots von Webseiten und indexiert sie.
- Metadatenverwaltung: Unterstützung für das Hinzufügen von Metadaten zu Dokumenten für eine einfache Klassifizierung und Abfrage.
- API-Schnittstelle: Bietet Python- und TypeScript-SDKs für die einfache Integration und Nutzung durch Entwickler.
- Sammlungsmanagement: Unterstützt die Verwaltung von Dokumenten in Sammlungen zur einfachen Organisation und Klassifizierung.
- Multimodale Suche: Unterstützt die modernste multimodale Suchfunktion.
- Keine Verwaltung der Vektordatenbank erforderlich: pgVector läuft im Hintergrund und der Benutzer muss die Vektordatenbank nicht verwalten.
- Open Source: ColiVara ist vollständig quelloffen und kann von den Nutzern frei verwendet und verändert werden.
Hilfe verwenden
Installation und Konfiguration
- Erhalten Sie einen API-Schlüssel: Besuchen Sie die ColiVara-Website, um sich anzumelden und einen kostenlosen API-Schlüssel zu erhalten.
- Installieren Sie das SDK:
- Python:
pip install colivara-py
- TypeScript:
npm install colivara-ts
- Python:
- Konfigurieren Sie den Client:
from colivara_py import ColiVara
client = ColiVara(api_key='Ihr API-Schlüssel')
Dokument hochladen
- Laden Sie das Dokument hoch:
Dokument = client.upsert_document(
name="sample_document",
document_url="https://example.com/sample.pdf",
collection_name="user_1_collection",
wait=True
)
- Laden Sie den Dateipfad oder die Base64-kodierte Datei hoch:
Dokument = client.upsert_document(
name="sample_document",
name="beispiel_dokument", dokument_pfad="/pfad/zu/beispiel.pdf",
collection_name="user_1_collection",
wait=True
)
Dokumentensuche
- Einfache Suche:
Ergebnisse = client.search("Was ist 1+1?")
- Suche nach Sammlungsnamen:
results = client.search("was ist 1+1?", collection_name="user_1_collection")
- Suche nach Metadaten filtern:
results = client.search(
"Was ist 1+1?",
query_filter={"on": "document", "key": "author", "value": "John Doe", "lookup": "key_lookup"}
)
Verwaltung von Sammlungen
- Sammlungen erstellen:
collection = client.create_collection(name="user_1_collection")
- Abrufen der Liste der Sammlungen:
Sammlungen = client.list_collections()
API-Referenz
- Dokument hochladen:
upsert_document(name, document_url, metadata, collection_name, wait)
- Dokumentenabruf:
suche(abfrage, sammlung_name, abfrage_filter)
- Gepoolte Verwaltung:
create_collection(name)
,list_collections()