AI2SRT: Erstellen Sie kurze kommentierte Videos oder Videozusammenfassungen für lange Videos mit einem Klick nach dem Gemini-Modell

Neueste AI-RessourcenGeschrieben vor 8 Monaten AI-Austauschkreis

12.6K 00

Allgemeine Einführung

AI2SRT ist ein Open-Source-Projekt, das das GeminiAI Big Model nutzt, um kurze kommentierte Videos und Videozusammenfassungen für lange Videos mit einem Klick zu generieren, sowie Audio- und Videotranskriptionsuntertitel zu unterstützen. Das Projekt zielt darauf ab, den Prozess der Erstellung von Videoinhalten zu vereinfachen und effiziente Funktionen für die Erzeugung von Untertiteln und die Übersetzung bereitzustellen. Benutzer können lange Videos schnell in kurze Videos umwandeln und entsprechende Untertiteldateien durch einfache Operationen generieren, die für eine Vielzahl von Szenarien geeignet sind, wie z. B. Bildung, Unterhaltung und Unternehmensförderung.

Das mit einer Webschnittstelle ausgestattete Tool ist einfach und intuitiv zu bedienen und unterstützt mehrere Plattformen, darunter Windows, Linux und Mac. Gemini ist in der Lage, Videoinhalte intelligent zu verstehen, professionelle Sprechertexte zu erstellen und hochwertige Untertitelübersetzungen nach der dreistufigen Reflexionsmethode zu unterstützen. Als pyVideoTrans Es werden Anpassungswerkzeuge verwendet.

Funktionsliste

Langes Video mit einem Klick zu erstellen AI Kommentar kurzes Video-Funktion
Intelligente Erstellung von Zusammenfassungsberichten für Videoinhalte
Unterstützung der dreistufigen Reflexionsmethode für die Übersetzung von SRT-Untertiteldateien
Automatische Transkription von Audio- und Videodateien in SRT-Untertitel
Web-Interface-Bedienung, Unterstützung plattformübergreifender Nutzung
Unterstützung benutzerdefinierter AI-Eingabewörter zur Optimierung der Ausgabe
Integrierte GeminiAI-Schnittstelle, unterstützt Gemini-1.5-Flash und andere Modelle

Hilfe verwenden

1. die Vorbereitung der Umwelt

Bevor Sie ai2srt verwenden, müssen Sie die folgenden Voraussetzungen erfüllen:

Stabile Web-Proxy-Umgebung (erforderlich)
GeminiAI API-Schlüssel (kostenlos zu beantragen)
Die Wahl der richtigen Betriebssystemversion

2) Installation und Einsatz

Schnelle Bereitstellung für Windows-Benutzer:

Laden Sie die neueste vorgepackte Version von der GitHub-Releases-Seite herunter
Entpacken Sie die heruntergeladene ZIP-Datei (z. B. window-gemini-video-tools-0.3.7z)
Doppelklicken Sie auf die Datei "startup.bat", um das Programm zu starten.
Das Programm öffnet automatisch die Benutzeroberfläche in Ihrem Browser: http://127.0.0.1:5030

Bereitstellungsschritte für Linux/Mac-Benutzer:

Klonen Sie das Code-Repository:

git clone https://github.com/jianchang512/ai2srt

Rufen Sie den Projektkatalog auf:

cd ai2srt

Erstellen und aktivieren Sie eine virtuelle Umgebung:

python3 -m venv venv
source ./venv/bin/activate

Installieren Sie die Abhängigkeitspakete:

pip3 install -r requirements.txt

Starten Sie die Anwendung:

python3 app.py

3. eine Beschreibung der funktionalen Nutzung

3.1 Videokommentar erstellen

Hochladen langer Videodateien zur Verarbeitung in der Webschnittstelle
Wählen Sie die Funktion "Erzählvideo erstellen".
Konfigurieren Sie GeminiAI-Parameter und Prompt-Wörter (optional)
Klicken Sie auf "Verarbeitung starten" und warten Sie, bis die KI die Analyse durchgeführt und den Kommentar erstellt hat.
Das System synthetisiert automatisch ein neues Video mit Erzählung

3.2 Transkription und Übersetzung von Untertiteln

Hochladen von zu bearbeitenden Audio- und Videodateien
Wählen Sie die Funktion "Untertitel-Transkription" oder "Untertitel-Übersetzung".
Für die Übersetzungsfunktion kann ein dreistufiger Reflexionsprozess verwendet werden, um die Qualität der Übersetzung zu gewährleisten
Warten Sie, bis die Verarbeitung abgeschlossen ist, und laden Sie dann die resultierende SRT-Untertiteldatei herunter.

3.3 Erstellung von Videozusammenfassungen

Videodatei hochladen
Wählen Sie die Funktion "Videozusammenfassung".
Warten auf KI, um Videoinhalte zu analysieren und zusammenfassende Berichte zu erstellen

4. vorsichtsmaßnahmen

Vergewissern Sie sich, dass der Netzwerk-Proxy während der Nutzung stabil ist; dies ist der Schlüssel zur Gewährleistung der ordnungsgemäßen Funktion des Tools
Es wird empfohlen, das Modell gemini-1.5-flash zu verwenden, das eine hohe Quote für die freie Nutzung hat.
Die AI-Ausgabe kann durch Anpassung der Cue-Wörter optimiert werden
Wenn die Verarbeitung fehlschlägt, überprüfen Sie zunächst den Status des Netzwerk-Proxys
Beachten Sie die Notwendigkeit, die Programmversion mit den neuesten Funktionen und Optimierungen auf dem neuesten Stand zu halten.