Allgemeine Einführung
Babelfish.ai ist eine Echtzeit-Transkriptions- und Übersetzungsanwendung, die auf Huggingface Transformer.js und Supabase Realtime basiert. Die Anwendung kann große Modelle in den Browser laden und lokal ausführen, was Sprach-zu-Text- und Übersetzungsfunktionen in Echtzeit ermöglicht. Benutzer können mit einfachen Einstellungen und Operationen Sprachinhalte schnell in Text transkribieren und in mehrere Sprachen übersetzen, was sich für eine Vielzahl von Szenarien eignet, z. B. für die Aufzeichnung von Besprechungen, sprachübergreifende Kommunikation usw.
Funktionsliste
- Sprache-zu-Text in Echtzeit: Effiziente Sprache-zu-Text-Funktionalität mit OpenAI Whisper.
- Echtzeit-Übersetzung: Unterstützt die Übersetzung von transkribiertem Text in 200 Sprachen, unter Verwendung des NLLB-200-Modells von Meta.
- Multi-Client-Broadcasting: Senden Sie transkribierte und übersetzte Inhalte in Echtzeit an abonnierte Clients über Supabase Realtime.
- Lokaler Betrieb: Es ist keine Serverunterstützung erforderlich, alle Operationen werden lokal im Browser durchgeführt.
- Einfaches Deployment: Unterstützt die lokale Ausführung und das Deployment auf GitHub Pages.
Hilfe verwenden
Installation und Betrieb
- lokaler Betrieb::
- Klon-Lagerhaus:
git clone https://github.com/supabase-community/babelfish.ai.git
- Rufen Sie den Projektkatalog auf:
cd babelfish.ai
- Kopieren Sie die Datei mit den Umgebungsvariablen:
cp .env.local.example .env.local
- Einstellen der Supabase Credentials: In der
.env.local
Geben Sie Ihre Supabase-Anmeldedaten in die Datei ein. - Installieren Sie die Abhängigkeit:
npm-Installation
- Starten Sie den Entwicklungsserver:
npm run dev
- Öffnen Sie Ihren Browser, um auf
http://localhost:3000
Verfügbar.
- Klon-Lagerhaus:
- Auf GitHub Pages bereitstellen::
- Konfigurieren Sie Ihre Geheimnisse in den Einstellungen Ihres GitHub-Repositorys.
- Übertragen Sie den Code in die
Haupt
Zweig wird GitHub Actions automatisch auf GitHub Pages bereitgestellt.
Verwendungsfunktionen
- Umwandlung von Sprache in Text in Echtzeit::
- Klicken Sie nach dem Öffnen der App auf die Schaltfläche "Transkription starten".
- Erlauben Sie dem Browser den Zugriff auf das Mikrofon und beginnen Sie zu sprechen.
- Sprachinhalte werden in Echtzeit als Text angezeigt.
- Echtzeit-Übersetzung::
- Während des Transkriptionsprozesses wird die Zielsprache ausgewählt.
- Der transkribierte Text wird automatisch in die ausgewählte Sprache übersetzt und auf der Benutzeroberfläche angezeigt.
- Multi-Client-Übertragung::
- Abonnementkunden können transkribierte und übersetzte Inhalte über Supabase Realtime erhalten.
- Öffnen Sie die App auf einem anderen Gerät und melden Sie sich mit demselben Supabase-Konto an, um die empfangenen Inhalte zu synchronisieren.
Erweiterte Einstellungen
- Kundenspezifische Modelle: zu finden in der
translationWorker.js
wird durch ein anderes unterstütztes Übersetzungsmodell ersetzt. - Anpassung der SchnittstelleModifikation
index.html
im Gesang antwortensrc
Die Dateien im Katalog können mit Anwendungsschnittstellen und Funktionen angepasst werden.