Allgemeine Einführung
MeetingMind ist eine fortschrittliche KI-Anwendung, die entwickelt wurde, um die Effizienz der Erfassung und Zusammenfassung von Geschäftsbesprechungen zu verbessern. Die App integriert die Whisper-Technologie von OpenAI für eine präzise Sprache-zu-Text-Erfassung und nutzt die KI von IBM Watson zur Analyse und Extraktion der wichtigsten Punkte im transkribierten Text. Der gesamte Prozess wird über eine benutzerfreundliche Schnittstelle von Hugging Face's Gradio abgewickelt, die auch für technisch nicht versierte Nutzer einfach zu bedienen ist.
Funktionsliste
- Sprache zu Text: Konvertiert gesprochene Inhalte in exakten Text unter Verwendung des Whisper-Modells von OpenAI.
- Meeting Summary: Integriert die KI-Verarbeitung von IBM Watson für transkribierten Text, um eine Zusammenfassung der wichtigsten Punkte des Meetings zu erstellen.
- Benutzerfreundliche Schnittstelle: Hugging Face Gradio bietet eine intuitive Webschnittstelle für einfache Benutzerinteraktion.
- Anzeige des Outputs in Echtzeit: Anzeige von Transkriptionen und Zusammenfassungen direkt in der Gradio-Oberfläche.
- Umgebungseinstellungen: so konfiguriert, dass eine nahtlose Bereitstellung mit einer virtuellen Python-Umgebung und den erforderlichen Bibliotheken möglich ist.
Hilfe verwenden
Ablauf der Installation
- Klon-Lager::
git klonen. https://github.com/misbahsy/meetingmind.git cd meetingmind
- Einrichten einer virtuellen Umgebung::
python -m venv env Quelle env/bin/aktivieren # Windows-Benutzer verwenden `env\Scripts\activate`.
- Installation der erforderlichen Bibliotheken::
pip install -r anforderungen.txt
- FFmpeg installierenInstallieren Sie FFmpeg so, wie es Ihr System für die Verarbeitung von Audiodateien benötigt.
- Setzen von Umgebungsvariablen: Erstellen Sie die
.env
Datei und fügen Sie den API-Schlüssel hinzu:OPENAI_API_KEY=Ihr_openai_api_schlüssel_hier IBM_WATSON_API_KEY=Ihr_ibm_watson_api_schlüssel_hier
- Ausführen der Anwendung::
python app.py
- ZugangsschnittstelleÖffnen Sie einen Browser und navigieren Sie zur Adresse des lokalen Servers, der von Gradio bereitgestellt wird (normalerweise die
http://127.0.0.1:7860
), um mit der MeetingMind-Anwendung zu interagieren.
Verwendung Prozess
- Hochladen von AudiodateienVerwenden Sie die Gradio-Schnittstelle, um Aufzeichnungen von Besprechungen hochzuladen.
- eine Kopie einer Aufnahme anfertigenDie App wird das Whisper-Modell von OpenAI nutzen, um gesprochene Inhalte in Text umzuwandeln.
- ZusammenfassungenIBM Watson AI verarbeitet den transkribierten Text, um eine Zusammenfassung der wichtigsten Punkte des Meetings zu erstellen.
- Ergebnisse anzeigenTranskriptionen und Zusammenfassungen in der Gradio-Oberfläche anzeigen.
MeetingMind wurde entwickelt, um den Benutzern das Erfassen und Zusammenfassen von Besprechungsinhalten zu erleichtern, was die Produktivität steigert und es besonders für Unternehmen und Bildungseinrichtungen geeignet macht.