AI Personal Learning
und praktische Anleitung

Trieve: eine Full-Service-RAG-Cloud-Infrastruktur für Suche, Empfehlungen und Analysen

Allgemeine Einführung

Trieve ist eine allumfassende Infrastruktur, die von Devflow, Inc. entwickelt wurde und für Suche, Empfehlungen, RAG (Retrieval Augmentation Generation) und Analytik konzipiert ist. Die Plattform wird über eine API bereitgestellt, wird selbst gehostet und ist für Umgebungen wie AWS, GCP, Kubernetes und Docker Compose verfügbar. Trieve integriert OpenAI und das Einbettungsmodell von Jina, bietet eine semantische Vektorsuche und unterstützt eine typotolerante Volltext-/Neuralsuche. Trieve unterstützt auch mehrere Filter- und Gruppierungsfunktionen, um die Genauigkeit und Relevanz von Suchergebnissen zu gewährleisten, und sein Empfehlungssystem bietet personalisierte Inhaltsempfehlungen auf der Grundlage des Nutzerverhaltens, um das Nutzererlebnis zu verbessern.

Trieve: eine Full-Service-RAG-Cloud-Infrastruktur für Suche, Empfehlungen und Analysen-1


 

Trieve: eine Full-Service-RAG-Cloud-Infrastruktur für Suche, Empfehlungen und Analysen-1

Quelloffenes PDF zu Markdown (PDF2MD): https://github.com/devflowinc/trieve/tree/main/pdf2md

 

Funktionsliste

  • selbst gehostetUnterstützt Self-Hosting in VPC- oder lokalen Umgebungen mit detaillierten Anleitungen für Self-Hosting.
  • semantische VektorsucheIntegrieren Sie OpenAI oder Jina eingebettete Modelle, um eine hochwertige semantische Vektorsuche zu ermöglichen.
  • Tippfehlertoleranz-SucheTypo-tolerante neuronale Sparse-Vektor-Suche unter Verwendung des naver/efficient-splade-VI-BT-large-query-Modells.
  • Hervorhebung einer KlauselVerbessern Sie die Benutzerfreundlichkeit, indem Sie übereinstimmende Wörter oder Sätze in den Suchergebnissen hervorheben.
  • EmpfehlungssystemPersonalisierte Empfehlungen auf der Grundlage des Nutzerverhaltens (z. B. Favoriten, Lesezeichen, Vorlieben) bereitstellen.
  • RAG-API-RoutingIntegriert sich in OpenRouter, bietet mehrere LLM-Zugriffsoptionen und unterstützt Topic Memory Management.
  • Hybride SucheReordering optimisation with BAAI/bge-reranker-large to provide the best search results.
  • Neigung zur FrischeVermeiden Sie veraltete Ergebnisse, indem Sie die Suchergebnisse auf der Grundlage der neuesten Inhalte beeinflussen.
  • Anpassbare KommerzialisierungRelevanzanpassung auf der Grundlage von Signalen wie Klicks, in den Warenkorb legen oder Zitate.
  • Mehrfache FiltrierungUnterstützung von Datumsbereich, Teilstringabgleich, Etikett, numerischem Wert und vielen anderen Filtertypen.
  • GruppierungsfunktionUnterstützung für die Markierung mehrerer Blöcke als Teil derselben Datei stellt sicher, dass die besten Ergebnisse nicht dupliziert werden.

 

Hilfe verwenden

Ablauf der Installation

  1. Vorbereiten der UmgebungStellen Sie sicher, dass die erforderlichen Pakete wie curl, gcc, g++, make, pkg-config, python3, libpq-dev, libssl-dev usw. installiert sind.
  2. Installation von NodeJS und YarnInstallieren Sie die NodeJS LTS Version mit NVM und installieren Sie Yarn global.
  3. Setzen von Umgebungsvariablen: Kopieren Sie die .env-Datei in das entsprechende Verzeichnis und fügen Sie den OpenAI-API-Schlüssel hinzu.
  4. Starten des Docker-DienstesStarten Sie den gewünschten Containerdienst mit docker-compose.
  5. lokale Entwicklungtmuxp: Verwenden Sie tmuxp oder Terminal Tabs, um die lokalen Entwicklungsdienste zu verwalten und die Module zu starten.

Richtlinien für die Verwendung

  1. Ein Konto erstellen: Besuchen Sie einen lokalen Server, erstellen Sie ein Konto und laden Sie einen Testdatensatz hoch.
  2. Suche nach DatensätzenSuche nach Datensätzen mit einem lokalen Server durchführen, um zu überprüfen, ob die Einrichtung richtig funktioniert.
  3. Fehlersuche und UnterstützungWenn Sie auf Probleme stoßen, erhalten Sie Unterstützung über Discord oder verwenden Sie diesel::debugAbfrage(&Abfrage).tostring() debuggt SQL-Abfragen.

Hauptfunktionen

  1. semantische VektorsucheNach dem Hochladen der Daten führt das System automatisch eine Vektorisierung durch, und der Nutzer kann über die API eine semantische Suche durchführen.
  2. EmpfehlungssystemBasierend auf den Daten zum Nutzerverhalten generiert das System automatisch empfohlene Inhalte, und die Nutzer können die empfohlenen Ergebnisse über die API abrufen.
  3. RAG-API-RoutingBenutzer können verschiedene LLMs für die RAG Betrieb, wird das System die besten Ergebnisse auf der Grundlage des Themas Speicherverwaltung liefern.
  4. Hybride SucheMit der hybriden Suchfunktion ordnet das System automatisch neu und optimiert, um die relevantesten Suchergebnisse zu liefern.
  5. Filterung und GruppierungBenutzer können je nach Bedarf verschiedene Filter und Gruppierungen festlegen, um die Genauigkeit und Relevanz der Suchergebnisse zu gewährleisten.

Mit der detaillierten Installations- und Nutzungsanleitung oben können Benutzer leicht mit den Funktionen von Trieve beginnen und die Vorteile der leistungsstarken Such-, Empfehlungs- und Analysefunktionen voll ausschöpfen.

Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Trieve: eine Full-Service-RAG-Cloud-Infrastruktur für Suche, Empfehlungen und Analysen

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)