Linly-Dubbing: herramienta inteligente de doblaje/traducción multilingüe de vídeo por IA

Últimos recursos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

87.4K 00

Introducción general

Linly-Dubbing es una herramienta inteligente de doblaje y traducción multilingüe diseñada para ofrecer a los usuarios servicios de doblaje de vídeo multilingüe y traducción de subtítulos de alta calidad mediante la integración de tecnología avanzada de IA. La herramienta es especialmente adecuada para escenarios como la educación internacional y la localización global de contenidos, ayudando a los equipos a difundir contenidos de alta calidad en todo el mundo.

Lista de funciones

Soporte multilingüe: Ofrece traducciones de doblaje y subtitulación en chino y muchos otros idiomas para satisfacer las necesidades de la globalización.
Reconocimiento de voz por IA: Conversión de voz a texto y reconocimiento de locutor mediante tecnología de IA avanzada.
Traducción de grandes modelos lingüísticosLa combinación de una modelización lingüística de vanguardia (por ejemplo, GPT) permite realizar traducciones con rapidez y precisión, garantizando la profesionalidad y la naturalidad.
Clonación de voz por IA: Gracias a una tecnología puntera de clonación de voces, genera una voz muy similar a la del doblaje original en vídeo, manteniendo la coherencia emocional y de entonación.
Tecnología digital de sincronización labial entre humanosGracias a la tecnología de sincronización labial, la voz en off se adapta perfectamente a la pantalla de vídeo, lo que aumenta la sensación de realismo e interactividad.
Carga y traducción flexiblesLos usuarios pueden subir vídeos y elegir su propio idioma y norma de traducción, lo que garantiza la personalización y la flexibilidad.
actualización periódica: Presentamos continuamente los últimos modelos para mantenernos a la vanguardia del doblaje y la traducción.

Utilizar la ayuda

Proceso de instalación

almacén de clonesEn primer lugar, clone el repositorio Linly-Dubbing en su máquina local e inicialice los submódulos.

git clone https://github.com/Kedreamix/Linly-Dubbing.git --depth 1
cd Linly-Dubbing
git submodule update --init --recursive

Instalación de dependenciasCree un nuevo entorno Python e instale las dependencias necesarias.

conda create -n linly_dubbing python=3.10 -y
conda activate linly_dubbing
cd Linly-Dubbing/
conda install ffmpeg==7.0.2 -c conda-forge
python -m pip install --upgrade pip
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt
pip install -r requirements_module.txt

Configuración de variables de entornoCree el archivo .env en el directorio raíz del proyecto y rellene las variables de entorno necesarias.
```
OPENAI_API_KEY=sk-xxx
MODEL_NAME=gpt-4
HF_TOKEN=your_hugging_face_token
```
Ejecutar la aplicaciónDescarga el modelo requerido e inicia la interfaz WebUI.
```
bash scripts/download_models.sh
python webui.py
```

Proceso de utilización

Cargar vídeoLos usuarios pueden cargar archivos de vídeo para doblarlos o traducirlos a través de la interfaz WebUI.
Selección de lengua y criteriosEl usuario puede seleccionar el idioma que desea traducir y la norma de doblaje después de cargar el vídeo.
Generar doblajes y subtítulos: El sistema realizará automáticamente el reconocimiento de voz, la traducción y la generación del doblaje, y sincronizará la generación de los archivos de subtítulos.
Descargar resultadosLos usuarios pueden descargar los archivos de vídeo doblado y subtítulos generados para su posterior edición y uso.

Funciones principales

Descarga automática de vídeos: Utiliza la herramienta yt-dlp para descargar vídeo y audio en distintos formatos y resoluciones.
separación vocalSeparación de pistas vocales y de acompañamiento mediante Demucs y la tecnología UVR5 para producir pistas de acompañamiento y extractos vocales de alta calidad.
Reconocimiento de voz por IAReconocimiento preciso del habla y generación de subtítulos mediante WhisperX y FunASR, con compatibilidad para el reconocimiento de varios hablantes.
Traducción de grandes modelos lingüísticosTraducciones multilingües de alta calidad que combinan la API OpenAI y el modelo Qwen.
Síntesis de voz por IA: Utilización de Edge TTS y CosyVoice Genere una salida de voz natural y fluida compatible con varios idiomas y estilos de voz.
Tratamiento de vídeoPersonaliza el contenido de tus vídeos añadiendo subtítulos, insertando música de fondo, ajustando el volumen y modificando la velocidad de reproducción.
Tecnología digital de sincronización labial entre humanosSincronización labial digital entre humanos mediante la tecnología Linly-Talker para mejorar la profesionalidad del vídeo y la experiencia de visionado.

Paquete de instalación de Linly-Dubbing con un solo clic

Quark: https://pan.quark.cn/s/f526eb488113

Disco: https://pan.baidu.com/s/1aapXpIc7qwO5h5sDzF9dLA?pwd=np7w

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

De paper a podcast: cómo convertir trabajos académicos en podcasts de conversación entre varias personas

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

048.5K

OpenAlternative：精选常用SaaS产品的开源软件替代方案，寻找最佳开源替代方案

OpenAlternative: una selección de alternativas de software de código abierto a los productos SaaS más utilizados, para encontrar las mejores alternativas de código abierto.

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

052.3K

MiniCPM-V 4.5 - Modelo multimodal facetado inteligente de código abierto de 8B parámetros

Últimos recursos sobre IA

hace 7 meses

052.2K

OpenPromptStudio：可视化编辑、管理图像提示词，同步自己的Notion提示词表

OpenPromptStudio: edita y gestiona visualmente avisos de imagen, sincroniza tus propias listas de avisos de Notion.

Últimos recursos sobre IA # AI Ayudas para la generación de imágenes # AI Java Proyecto de código abierto

hace 1 año

049.2K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Linly-Dubbing: herramienta inteligente de doblaje/traducción multilingüe de vídeo por IA

Introducción general

Lista de funciones