Allgemeine Einführung
MeetingMind ist eine fortschrittliche KI-Anwendung, die die Effizienz der Erfassung und Zusammenfassung von Geschäftsbesprechungen verbessern soll. Die App integriert OpenAIs Flüstern Technologie für präzise Sprache-zu-Text und nutzt die KI von IBM Watson, um Schlüsselpunkte im transkribierten Text zu analysieren und zu extrahieren. Der gesamte Prozess wird über eine benutzerfreundliche Schnittstelle von Hugging Face's Gradio abgewickelt, die auch für technisch nicht versierte Benutzer einfach zu bedienen ist.
Funktionsliste
- Sprache zu Text: Konvertiert gesprochene Inhalte in exakten Text unter Verwendung des Whisper-Modells von OpenAI.
- Meeting Summary: Integriert die KI-Verarbeitung von IBM Watson für transkribierten Text, um eine Zusammenfassung der wichtigsten Punkte des Meetings zu erstellen.
- Benutzerfreundliche Schnittstelle: Hugging Face Gradio bietet eine intuitive Webschnittstelle für einfache Benutzerinteraktion.
- Anzeige des Outputs in Echtzeit: Anzeige von Transkriptionen und Zusammenfassungen direkt in der Gradio-Oberfläche.
- Umgebungseinstellungen: so konfiguriert, dass eine nahtlose Bereitstellung mit einer virtuellen Python-Umgebung und den erforderlichen Bibliotheken möglich ist.
Hilfe verwenden
Ablauf der Installation
- Klon-Lager::
git klonen. https://github.com/misbahsy/meetingmind.git cd meetingmind
- Einrichten einer virtuellen Umgebung::
python -m venv env Quelle env/bin/aktivieren # Windows-Benutzer verwenden `env\Scripts\activate`.
- Installation der erforderlichen Bibliotheken::
pip install -r anforderungen.txt
- FFmpeg installierenInstallieren Sie FFmpeg so, wie es Ihr System für die Verarbeitung von Audiodateien benötigt.
- Setzen von Umgebungsvariablen: Erstellen Sie die
.env
Datei und fügen Sie den API-Schlüssel hinzu:OPENAI_API_KEY=Ihr_openai_api_schlüssel_hier IBM_WATSON_API_KEY=Ihr_ibm_watson_api_schlüssel_hier
- Ausführen der Anwendung::
python app.py
- ZugangsschnittstelleÖffnen Sie einen Browser und navigieren Sie zur Adresse des lokalen Servers, der von Gradio bereitgestellt wird (normalerweise die
http://127.0.0.1:7860
), um mit der MeetingMind-Anwendung zu interagieren.
Verwendung Prozess
- Hochladen von AudiodateienVerwenden Sie die Gradio-Schnittstelle, um Aufzeichnungen von Besprechungen hochzuladen.
- eine Kopie einer Aufnahme anfertigenDie App wird das Whisper-Modell von OpenAI nutzen, um gesprochene Inhalte in Text umzuwandeln.
- ZusammenfassungenIBM Watson AI verarbeitet den transkribierten Text, um eine Zusammenfassung der wichtigsten Punkte des Meetings zu erstellen.
- Ergebnisse anzeigenTranskriptionen und Zusammenfassungen in der Gradio-Oberfläche anzeigen.
MeetingMind wurde entwickelt, um den Benutzern das Erfassen und Zusammenfassen von Besprechungsinhalten zu erleichtern, was die Produktivität steigert und es besonders für Unternehmen und Bildungseinrichtungen geeignet macht.