Voice-Pro: multifunktionales Open-Source-Videoübersetzungsprogramm, Sprachtranskription und Übersetzung in mehrere Sprachen, Windows-Installation mit einem Klick

Neueste AI-RessourcenGeschrieben vor 10 Monaten AI-Austauschkreis

Allgemeine Einführung

Voice-Pro ist ein multifunktionales Tool auf Basis der Gradio WebUI, das Sprache-zu-Text, Text-zu-Sprache, Echtzeit-Übersetzung, YouTube-Video-Downloads und die Trennung menschlicher Stimmen unterstützt. Es integriert die Technologien Whisper, Faster-Whisper und Whisper-Timestamped, um eine effiziente Audioverarbeitung und Übersetzung für mehrere Sprachen und Szenarien zu ermöglichen.

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Funktionsliste

Sprache-zu-TextUnterstützt Whisper, Faster-Whisper und Whisper-Timestamped und bietet eine hochpräzise Spracherkennung.
Text-to-SpeechEdge-TTS- und F5-TTS-Unterstützung mit mehreren Sprach- und Sprachauswahlmöglichkeiten sowie Unterstützung für die Anpassung von Geschwindigkeit, Lautstärke und Tonhöhe.
Echtzeit-ÜbersetzungUnterstützt Echtzeit-Spracherkennung und Übersetzung für mehrere Sprachen.
YouTube HerunterladenSie können YouTube-Videos herunterladen und Audio (mp3, wav, flac) extrahieren.
StimmbruchVocal and background sound separation using MDX-Net and Demucs engines.
StapeldateiUnterstützt die Erstellung von Untertiteln, die Übersetzung und die Text-zu-Sprache-Verarbeitung von großen Dateimengen.
Untertitel GenerationUnterstützt die Erstellung und Bearbeitung von Untertiteln in über 90 Sprachen.
Unterstützung mehrerer FormateAlle von ffmpeg unterstützten Video- und Audioformate werden unterstützt.

Hilfe verwenden

Einbauverfahren

StartersetKlonen Sie oder laden Sie die neueste Version des Quellcodes von GitHub herunter.
```
git clone https://github.com/abus-aikorea/voice-pro.git
```

Installieren und Ausführen des Programms::
- in Bewegung sein configure.bat Installieren Sie die erforderlichen Abhängigkeiten (z. B. git, ffmpeg und CUDA).
- in Bewegung sein start.bat Starten Sie Voice-Pro und WebUI wird automatisch ausgeführt.
- Beim ersten Start wird Voice-Pro zunächst installiert, was eine Stunde oder länger dauern kann.

Verwendungsfunktionen

Sprache-zu-Text::
- Wählen Sie auf der Registerkarte Studio Flüstern Modelle und Arten von Berechnungen.
- Laden Sie eine Audiodatei hoch oder wählen Sie eine Audioeingangsquelle (z. B. ein Mikrofon).
- Klicken Sie auf die Schaltfläche "Start" und warten Sie, bis die Spracherkennung und die Erstellung von Untertiteln abgeschlossen sind.
Rendering::
- Laden Sie den zu übersetzenden Text oder die Untertiteldatei auf der Registerkarte Übersetzen hoch.
- Wählen Sie die Zielsprache und klicken Sie auf die Schaltfläche "Übersetzen".
- Sobald die Übersetzung abgeschlossen ist, können Sie die übersetzte Datei herunterladen.
Text-to-Speech::
- Wählen Sie Edge-TTS oder F5-TTS auf der Registerkarte TTS.
- Geben Sie den umzuwandelnden Text ein und wählen Sie die Sprachparameter (z. B. Geschwindigkeit, Lautstärke, Tonhöhe).
- Klicken Sie auf die Schaltfläche "Stimme generieren" und warten Sie, bis die Stimmerzeugung abgeschlossen ist.
YouTube Herunterladen::
- Geben Sie den YouTube-Video-Link auf der Registerkarte YouTube-Downloader ein.
- Wählen Sie das Audioformat (mp3, wav, flac) und klicken Sie auf die Schaltfläche "Herunterladen".
- Sobald der Download abgeschlossen ist, finden Sie die Audiodatei in dem angegebenen Ordner.
solide Trennung::
- Laden Sie Audiodateien auf der Registerkarte "Vocal Remover" hoch.
- Wählen Sie die MDX-Net- oder Demucs-Engine aus und klicken Sie auf die Schaltfläche Start.
- Warten Sie, bis die Trennung des Tons abgeschlossen ist und Sie die getrennte Audiodatei herunterladen können.
Stapeldatei::
- Laden Sie mehrere Dateien auf der Registerkarte Batch hoch.
- Wählen Sie die gewünschte Funktion (Untertitel, Übersetzung, Text-to-Speech).
- Klicken Sie auf die Schaltfläche "Start" und warten Sie, bis die Stapelverarbeitung abgeschlossen ist.

allgemeine Probleme

Browser läuft nicht automatisch: Schließen Sie das Windows-Befehlsfenster und führen Sie erneut aus start.batoder geben Sie die angezeigte Adresse manuell in Ihren Browser ein (z. B. http://127.0.0.1:7892).
CUDA-Fehler wegen SpeichermangelsÜberprüfen Sie den GPU-Speicherstatus und passen Sie die Rauschunterdrückungsstufe oder den Berechnungstyp an.
Windows Defender-Warnung: Fügen Sie die Batch-Datei als Ausnahme hinzu oder deaktivieren Sie Windows Defender vorübergehend.