AI Personal Learning
und praktische Anleitung

Denser Chat: Interaktion mit PDF-Dateien, Hervorhebung des Quellcodes

Allgemeine Einführung

Denser Chat ist ein Chatbot-Projekt, das von denser.ai entwickelt und gepflegt wird, um Text und Tabellen aus PDF-Dateien und Webseiten mit Quellcode-Hervorhebung zu extrahieren. Das Projekt unterstützt die Erstellung von Chatbots auf Basis von denser-retriever und bietet interaktive Streamlit-Chatbot-Anwendungen. Benutzer können den Chatbot schnell einsetzen und nutzen, um Fragen zu PDF- und Webinhalten mit einfacher Installation und Konfiguration zu beantworten.

Denser Chat: Interaktion mit PDF-Dateien, Quellcode-Hervorhebung-1


 

Funktionsliste

  • Extrahieren von Text und Tabellen aus PDF-Dateien und Webseiten
  • Aufbau eines Chatbots auf Basis von Denser-Retriever
  • Unterstützung für interaktive Streamlit-Chatbot-Anwendungen
  • Quellcode-Hervorhebungsfunktion bereitstellen
  • Unterstützt mehrere Dateiformate und URLs als Datenquellen
  • Starten von Elasticsearch- und Milvus-Diensten mit Docker Compose
  • Verwenden Sie OpenAI oder Claude API zur Bereitstellung von Chat-Funktionen

 

Hilfe verwenden

Ablauf der Installation

  1. Klon-Lagerhaus:
   git clone https://github.com/denser-org/denser-chat.git
  1. Wechseln Sie in das Projektverzeichnis und starten Sie die virtuelle Umgebung (stellen Sie sicher, dass die Python-Version 3.11 ist):
   cd denser-chat
python -m venv .venv
Quelle .venv/bin/activate
  1. Installieren Sie die erforderlichen Pakete:
   pip install -e .

Oder verwenden Sie Poesie:

   Poesie installieren

Schnellstart

  1. Bevor Sie die Indizes erstellen, führen Sie Docker Compose aus, um die Dienste Elasticsearch und Milvus zu starten:
   cd denser_chat
docker compose up -d
  1. Aufbau eines Chatbot-Index:
   python build.py sources.txt output test_index

wobei der erste Parameter die Datei ist, die zur Erstellung des Chatbots verwendet wird, d.h. eine lokale PDF-Datei, eine URL-PDF-Datei oder eine URL. Der zweite Parameter ist das Ausgabeverzeichnis, und der dritte Parameter ist der Indexname.

  1. Starten Sie den lokalen Server, um PDF-Dienste bereitzustellen:
   python -m http.server 8000
  1. Starten Sie die Streamlit-Anwendung:
   cd denser_chat
streamlit run demo.py -- --index_name test_index

Verwendungsfunktionen

  • Text und Tabellen extrahierenLaden Sie eine PDF-Datei hoch oder geben Sie die URL einer Webseite ein, und Denser Chat extrahiert automatisch den Text- und Tabelleninhalt daraus.
  • Quellcode-HervorhebungWährend des Chats hebt Denser Chat den relevanten Quellcode in der PDF-Datei hervor, damit er leicht zu sehen und zu verstehen ist.
  • interaktiver ChatDurch die Konfiguration von OpenAI oder Claude API-Schlüsseln können Nutzer mit Chatbots interagieren, um genaue Antworten zu erhalten.

Detaillierte Vorgehensweise

  1. Hochladen von DateienAuswahl und Hochladen einer PDF-Datei in der Anwendungsschnittstelle oder Eingabe einer Webseiten-URL.
  2. Fragen stellenFragen in das Chat-Fenster eingeben, z. B. "Was ist eine negative Probenahme innerhalb einer Charge? oder "Welche Teile haben Stoppstifte?". .
  3. Ergebnisse anzeigenDenser Chat liefert Antworten mit Hervorhebungen, so dass die Nutzer schnell relevante Inhalte finden können.
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Denser Chat: Interaktion mit PDF-Dateien, Hervorhebung des Quellcodes

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)