AI2SRT: Creación de vídeos narrados breves o resúmenes de vídeos largos en un solo clic mediante modelos Gemini

Introducción general

AI2SRT es un proyecto de código abierto que utiliza el modelo GeminiAI Big Model para generar vídeos narrados cortos y resúmenes de vídeo para vídeos largos con un solo clic, así como subtítulos de transcripción de audio y vídeo. El proyecto pretende simplificar el proceso de creación de contenidos de vídeo y ofrecer funciones eficaces de generación y traducción de subtítulos. Los usuarios pueden convertir rápidamente vídeos largos en cortos y generar los correspondientes archivos de subtítulos mediante sencillas operaciones, que resultan adecuadas para diversos escenarios, como la educación, el entretenimiento y la promoción empresarial.

Diseñada con una interfaz web, la herramienta es de uso sencillo e intuitivo, y es compatible con múltiples plataformas, como Windows, Linux y Mac. Con la potente capacidad de Gemini para comprender de forma inteligente el contenido de vídeo, generar una copia de narración profesional y admitir la traducción de subtítulos de alta calidad mediante el método de reflexión en tres pasos, la herramienta es un poderoso asistente para creadores de vídeo y editores de contenidos. Como pyVideoTrans Se utilizan herramientas de concordancia.

AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结

 

Lista de funciones

  • Vídeo largo un clic para crear AI comentario función de vídeo corto
  • Generación inteligente de informes de resumen de contenidos de vídeo
  • Admite el método de reflexión en tres pasos para traducir archivos de subtítulos SRT
  • Transcripción automática de archivos de audio y vídeo a subtítulos SRT
  • Funcionamiento mediante interfaz web, compatible con el uso multiplataforma
  • Admite palabras de aviso AI personalizadas para optimizar la salida
  • Interfaz GeminiAI integrada, compatible con gemini-1.5-flash y otros modelos

 

Utilizar la ayuda

1. Preparación medioambiental

Antes de empezar a utilizar ai2srt, debes asegurarte de que se cumplen las siguientes condiciones:

  • Entorno proxy web estable (obligatorio)
  • Clave API de GeminiAI (solicitud gratuita)
  • Elegir la versión correcta del sistema operativo

2. Instalación y despliegue

Implantación rápida para usuarios de Windows:

  1. Descargue la última versión preempaquetada desde la página de versiones de GitHub
  2. Extraiga el archivo zip descargado (por ejemplo, window-gemini-video-tools-0.3.7z)
  3. Haz doble clic en el archivo "startup.bat" para ejecutar el programa.
  4. El programa abrirá automáticamente la interfaz del operador en su navegador: http://127.0.0.1:5030

Pasos de implantación para usuarios de Linux/Mac:

  1. Clonar el repositorio de código:
git clone https://github.com/jianchang512/ai2srt
  1. Vaya al catálogo de proyectos:
cd ai2srt
  1. Crear y activar un entorno virtual:
python3 -m venv venv
source ./venv/bin/activate
  1. Instale los paquetes de dependencia:
pip3 install -r requirements.txt
  1. Inicie la aplicación:
python3 app.py

3. Descripción del uso funcional

3.1 Crear una narración de vídeo

  1. Cargar archivos de vídeo largos para procesarlos en la interfaz web
  2. Seleccione la función "Crear vídeo narrado".
  3. Configurar los parámetros de GeminiAI y las palabras de aviso (opcional)
  4. Haz clic en Iniciar procesamiento y espera a que la IA analice y genere el comentario
  5. El sistema sintetizará automáticamente un nuevo vídeo con narración

3.2 Transcripción y traducción de subtítulos

  1. Cargar archivos de audio y vídeo para procesarlos
  2. Seleccione la función "Transcripción de subtítulos" o "Traducción de subtítulos".
  3. Para la función de traducción, puede utilizarse un proceso de reflexión en tres fases para garantizar la calidad de la traducción
  4. Espere a que finalice el procesamiento y descargue el archivo de subtítulos SRT resultante.

3.3 Generación de resúmenes de vídeo

  1. Cargar archivo de vídeo
  2. Seleccione la función "Resumen de vídeo".
  3. A la espera de que la IA analice los contenidos de vídeo y genere informes resumidos

4. Precauciones

  1. Asegúrese de que el proxy de red es estable durante el uso, esta es la clave para garantizar que la herramienta funciona correctamente
  2. Se recomienda utilizar el modelo gemini-1.5-flash, que tiene una elevada cuota de uso libre
  3. La salida de IA puede optimizarse ajustando las palabras clave
  4. Si se produce un fallo de procesamiento, compruebe primero el estado del proxy de red
  5. Sea consciente de la necesidad de mantener actualizada la versión del programa con las últimas funciones y optimizaciones.
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...