AI Personal Learning
und praktische Anleitung

FunClip: Intelligente Bearbeitung von Videoinhalten zu Kurzfilmen, einfaches und präzises Extrahieren/Croppen von Videoclips

Allgemeine Einführung

FunClip ist ein vollständig quelloffenes, lokalisiertes, automatisches Videobearbeitungstool, das vom TONGYI Speech Lab am Alibaba Dharma Institute entwickelt wurde. In das Tool ist das industrietaugliche Spracherkennungsmodell Paraformer-Large integriert, das den Sprachinhalt im Video genau identifizieren und in Text umwandeln kann. Das Besondere an FunClip ist, dass es intelligentes Editieren durch Large Language Modelling (LLM) unterstützt und eine Sprechererkennung integriert, um verschiedene Sprecher automatisch zu identifizieren. Die Benutzer können die gewünschten Textclips auswählen und die entsprechenden Videoclips mit einem Klick über eine einfache Benutzeroberfläche exportieren. Das Tool unterstützt die freie Bearbeitung von mehreren Segmenten und kann automatisch vollständige SRT-Untertiteldateien und Untertitel für die Zielsegmente generieren, was dem Benutzer eine einfache und bequeme Videobearbeitung ermöglicht. Die neueste Version unterstützt die zweisprachige Erkennung und bietet umfangreiche Funktionen zum Einbetten und Exportieren von Untertiteln - ein leistungsstarkes und benutzerfreundliches Open-Source-Videobearbeitungsprogramm.

FunClip: schnelle Bearbeitung von Videoinhalten, intelligente Erkennung von Sprachtexten, einfache und präzise Extraktion von Videoclips-1


 

FunClip Optimiert - Privat-ASR

Privat-ASR Basierend auf Open-Source-Projekten FunClip Modifiziert, um automatische Spracherkennung (ASR), Sprechertrennung, SRT-Untertitelbearbeitung und LLM-basierte Zusammenfassung zu integrieren. Das Projekt verwendet Gradio Bietet eine intuitive und einfach zu bedienende Benutzeroberfläche.

FunClip: Intelligente Bearbeitung von Videoinhalten zu Kurzfilmen, einfaches und genaues Extrahieren/Croppen von Videoclips-1

 

Funktionsliste

  • Präzise Spracherkennung: Integration des Open-Source-Modells Paraformer-Large von Alibaba, das chinesische und englische Spracherkennung unterstützt.
  • LLM Intelligent Clip: Unterstützt die intelligente Analyse von Inhalten und die automatische Bestimmung von Clip-Punkten mit Hilfe eines umfangreichen Sprachmodells
  • Sprechererkennung: Integration des CAM++ Sprechererkennungsmodells, das automatisch die Identität verschiedener Sprecher erkennen kann
  • Hot-Word-Anpassung: Unterstützung der Hot-Word-Anpassungsfunktion von SeACo-Paraformer zur Verbesserung der Genauigkeit der Erkennung bestimmter Wörter.
  • Bearbeitung mehrerer Segmente: Unterstützung der freien Auswahl mehrerer Textsegmente für die Stapelverarbeitung
  • Untertitelgenerierung: Automatische Generierung von SRT-Vollvideountertiteln und Zielclipuntertiteln.
  • Zweisprachige Unterstützung: unterstützt chinesische und englische Videoerkennung und -bearbeitung
  • Lokale Bereitstellung: vollständig quelloffen, Unterstützung für lokale Bereitstellung, Schutz der Privatsphäre und Datensicherheit
  • Benutzerfreundliche Schnittstelle: basiert auf der Gradio-Framework-Entwicklung und bietet eine einfache und intuitive Webschnittstelle

 

Hilfe verwenden

1. die Installation und der Einsatz

Grundlegende Installation der Umgebung

  1. Klonen Sie das Code-Repository:
git clone https://github.com/alibaba-damo-academy/FunClip.git
cd FunClip
  1. Installieren Sie die Python-Abhängigkeiten:
pip install -r . /requirements.txt

Optionale Funktionsinstallation (für eingebettete Untertitel)

Um die Funktion zum Einbetten von Untertiteln zu nutzen, müssen Sie ffmpeg und imagemagick installieren:

  • Ubuntu:
apt-get -y update && apt-get -y install ffmpeg imagemagick
sed -i 's/none/read,write/g' /etc/ImageMagick-6/policy.xml
  • MacOS:
brew install imagemagick
sed -i 's/none/read,write/g' /usr/local/Cellar/imagemagick/7.1.1-8_1/etc/ImageMagick-7/policy.xml
  • Fenster:
  1. Laden Sie imagemagick von der offiziellen Website herunter und installieren Sie es: https://imagemagick.org/script/download.php#windows
  2. Suchen Sie den Python-Installationspfad und ändern Sie diesite-packages\moviepy\config_defaults.pyden Nagel auf den Kopf treffenIMAGEMAGICK_BINARYInstallationspfad für imagemagick
  3. Laden Sie die Schriftartdatei herunter:
wget https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ClipVideo/STHeitiMedium.ttc -O font/STHeitiMedium.ttc

2. die Verwendungsmodalitäten

A. Nutzung des lokalen Gradio-Dienstes

  1. Starten Sie den Dienst:
python funclip/launch.py
# Verwendung des Parameters -l en zur Unterstützung der englischen Erkennung
# Verwenden Sie -p xxx, um die Portnummer festzulegen.
# Aktivieren Sie den öffentlichen Zugang mit -s True
  1. Interviewslocalhost:7860folgen Sie den nachstehenden Schritten:
  • Schritt 1: Hochladen von Videodateien
  • Schritt 2: Kopieren Sie den gewünschten Textclip in den Bereich "Text to Clip".
  • Schritt 3: Untertiteleinstellungen nach Bedarf anpassen
  • Schritt 4: Klicken Sie zum Bearbeiten auf "Ausschnitt" oder "Ausschnitt und Untertitel generieren".

B. LLM Smart Clips

  1. Nachdem die Erkennung abgeschlossen ist, wählen Sie das große Sprachmodell aus und konfigurieren Sie apikey
  2. Klicken Sie auf die Schaltfläche "LLM-Inferenz", und das System wird die Videountertitel automatisch mit den voreingestellten Stichwörtern kombinieren.
  3. Klicken Sie auf die Schaltfläche "KI-Clip", um auf der Grundlage der Ausgabe des großen Sprachmodells automatisch Zeitstempel für die Bearbeitung zu extrahieren.
  4. Die Ausgabe eines großen Sprachmodells kann durch Änderung der Stichwortwörter optimiert werden

C. Verwendung der Befehlszeile

  1. Erkennung von Sprache:
python funclip/videoclipper.py --stage 1 \
--Datei examples/video.mp4 \
--output_dir . /Ausgabe
  1. Videoclip:
python funclip/videoclipper.py --stage 2 \
--Datei examples/video.mp4 \
--output_dir . /output \
--dest_text 'zu beschneidender Text' \
--start_ost 0 \
--end_ost 100 \
--output_file '. /output/res.mp4'

Außerdem können die Nutzer FunClip über die folgenden Online-Plattformen erleben:

Wenn Sie Probleme mit der Nutzung haben, können Sie über die vom Projekt bereitgestellte Pinn- oder WeChat-Gruppe Unterstützung von der Community erhalten.

Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " FunClip: Intelligente Bearbeitung von Videoinhalten zu Kurzfilmen, einfaches und präzises Extrahieren/Croppen von Videoclips

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)