Allgemeine Einführung
AI2SRT ist ein Open-Source-Projekt, das das GeminiAI Big Model nutzt, um kurze kommentierte Videos und Videozusammenfassungen für lange Videos mit einem Klick zu generieren, sowie Audio- und Videotranskriptionsuntertitel zu unterstützen. Das Projekt zielt darauf ab, den Prozess der Erstellung von Videoinhalten zu vereinfachen und effiziente Funktionen für die Erzeugung von Untertiteln und die Übersetzung bereitzustellen. Benutzer können lange Videos schnell in kurze Videos umwandeln und entsprechende Untertiteldateien durch einfache Operationen generieren, die für eine Vielzahl von Szenarien geeignet sind, wie z. B. Bildung, Unterhaltung und Unternehmensförderung.
Das mit einer Webschnittstelle ausgestattete Tool ist einfach und intuitiv zu bedienen und unterstützt mehrere Plattformen, darunter Windows, Linux und Mac. Gemini ist in der Lage, Videoinhalte intelligent zu verstehen, professionelle Sprechertexte zu erstellen und hochwertige Untertitelübersetzungen nach der dreistufigen Reflexionsmethode zu unterstützen. Als pyVideoTrans Es werden Anpassungswerkzeuge verwendet.
Funktionsliste
- Langes Video mit einem Klick zu erstellen AI Kommentar kurzes Video-Funktion
- Intelligente Erstellung von Zusammenfassungsberichten für Videoinhalte
- Unterstützung der dreistufigen Reflexionsmethode für die Übersetzung von SRT-Untertiteldateien
- Automatische Transkription von Audio- und Videodateien in SRT-Untertitel
- Web-Interface-Bedienung, Unterstützung plattformübergreifender Nutzung
- Unterstützung benutzerdefinierter AI-Eingabewörter zur Optimierung der Ausgabe
- Integrierte GeminiAI-Schnittstelle, unterstützt Gemini-1.5-Flash und andere Modelle
Hilfe verwenden
1. die Vorbereitung der Umwelt
Bevor Sie ai2srt verwenden, müssen Sie die folgenden Voraussetzungen erfüllen:
- Stabile Web-Proxy-Umgebung (erforderlich)
- GeminiAI API-Schlüssel (kostenlos zu beantragen)
- Die Wahl der richtigen Betriebssystemversion
2. die Installation und der Einsatz
Schnelle Bereitstellung für Windows-Benutzer:
- Laden Sie die neueste vorgepackte Version von der GitHub-Releases-Seite herunter
- Entpacken Sie die heruntergeladene ZIP-Datei (z. B. window-gemini-video-tools-0.3.7z)
- Doppelklicken Sie auf die Datei "startup.bat", um das Programm zu starten.
- Das Programm öffnet automatisch die Benutzeroberfläche in Ihrem Browser: http://127.0.0.1:5030
Bereitstellungsschritte für Linux/Mac-Benutzer:
- Klonen Sie das Code-Repository:
git clone https://github.com/jianchang512/ai2srt
- Rufen Sie den Projektkatalog auf:
cd ai2srt
- Erstellen und aktivieren Sie eine virtuelle Umgebung:
python3 -m venv venv
Quelle. /venv/bin/activate
- Installieren Sie die Abhängigkeitspakete:
pip3 install -r anforderungen.txt
- Starten Sie die Anwendung:
python3 app.py
3. eine Beschreibung der funktionalen Nutzung
3.1 Videokommentar erstellen
- Hochladen langer Videodateien zur Verarbeitung in der Webschnittstelle
- Wählen Sie die Funktion "Erzählvideo erstellen".
- Konfigurieren Sie GeminiAI-Parameter und Prompt-Wörter (optional)
- Klicken Sie auf "Verarbeitung starten" und warten Sie, bis die KI die Analyse durchgeführt und den Kommentar erstellt hat.
- Das System synthetisiert automatisch ein neues Video mit Erzählung
3.2 Transkription und Übersetzung von Untertiteln
- Hochladen von zu bearbeitenden Audio- und Videodateien
- Wählen Sie die Funktion "Untertitel-Transkription" oder "Untertitel-Übersetzung".
- Für die Übersetzungsfunktion kann ein dreistufiger Reflexionsprozess verwendet werden, um die Qualität der Übersetzung zu gewährleisten
- Warten Sie, bis die Verarbeitung abgeschlossen ist, und laden Sie dann die resultierende SRT-Untertiteldatei herunter.
3.3 Erstellung von Videozusammenfassungen
- Videodatei hochladen
- Wählen Sie die Funktion "Videozusammenfassung".
- Warten auf KI, um Videoinhalte zu analysieren und zusammenfassende Berichte zu erstellen
4. vorsichtsmaßnahmen
- Vergewissern Sie sich, dass der Netzwerk-Proxy während der Nutzung stabil ist; dies ist der Schlüssel zur Gewährleistung der ordnungsgemäßen Funktion des Tools
- Es wird empfohlen, das Modell gemini-1.5-flash zu verwenden, das eine hohe Quote für die freie Nutzung hat.
- Die AI-Ausgabe kann durch Anpassung der Cue-Wörter optimiert werden
- Wenn die Verarbeitung fehlschlägt, überprüfen Sie zunächst den Status des Webagenten
- Beachten Sie die Notwendigkeit, die Programmversion mit den neuesten Funktionen und Optimierungen auf dem neuesten Stand zu halten.