Conversión de voz basada en recuperación WebUI: un marco para la conversión de voz basada en recuperación | Simulación de voces cantadas en la vida real

Últimos recursos sobre IAPublicado hace 2 años Círculo de intercambio de inteligencia artificial

66.8K 00

Introducción general

Recuperación La WebUI de conversión de voz basada en VITS es un marco de conversión de voz basado en VITS sencillo y fácil de usar, que puede realizar la conversión de voz entre cualquier altavoz, incluidas las carátulas de canciones y el cambio de voz en tiempo real. Se caracteriza por su baja latencia, excelente efecto de conversión de voz, pequeña cantidad de formación de datos, etc. Soporta aceleración por tarjeta N, tarjeta A, tarjeta I, proporciona interfaz web e interfaz de conversión de voz en tiempo real, y también puede llamar al modelo UVR5 para separar rápidamente la voz humana y los coros, y utilizar el algoritmo de extracción de tono vocal más avanzado RMVPE para eliminar el problema de las voces mudas.

experiencia colab en línea

El modelo inferior se ha entrenado utilizando cerca de 50 horas del conjunto de entrenamiento VCTK de código abierto y alta calidad, sin problemas de derechos de autor.
Esperamos con impaciencia el modelo inferior de RVCv3, con mayores parámetros, mayores datos, mejores resultados, una velocidad de inferencia esencialmente igual y menos datos de entrenamiento necesarios.

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

Interfaz de razonamiento de formación

Interfaz de cambio de voz en tiempo real

Lista de funciones

Entrene su propio modelo de conversión de voz con tan sólo 10 minutos de datos de voz
Admite múltiples frecuencias de muestreo y tonos mediante modelos de conversión de voz preentrenados.
Conversión de voz mediante una interfaz web o una interfaz de alteración de voz en tiempo real con soporte de baja latencia de extremo a extremo.
Separación de voces y pistas de acompañamiento mediante el modelado UVR5, compatible con varios formatos de archivo de audio
Utilización del algoritmo RMVPE para extraer el tono vocal, compatibilidad con pytorch/onnx/DirectML

Utilizar la ayuda

Descargue o clone este repositorio e instale las dependencias y los modelos previos necesarios.
Ejecute go-web.bat o go-realtime-gui.bat y seleccione la acción que desea realizar.
Según las indicaciones de la interfaz, selecciona los archivos o dispositivos de voz de entrada y salida, ajusta los parámetros y las opciones
Haz clic en iniciar o detener y disfruta de la conversión de voz.

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

LiblibAI - Mile High: Use Stable Diffusion en línea gratis, ¡genere 200 imágenes al día gratis!

Últimos recursos sobre IA # AI generación de imágenes en línea # Difusión estable

hace 2 años

080.3K

Beanbag Big Model 1.6 - Multimodal Deep Thinking Big Model del equipo Beanbag en WordPop

Últimos recursos sobre IA

hace 10 meses

0190.5K

Logics-Parsing - Modelo de análisis sintáctico de documentos de código abierto Ali

Últimos recursos sobre IA

hace 6 meses

041.1K

PodLM: genere podcasts de audio multilingües de diálogos, páginas web o textos largos (de pago)

Últimos recursos sobre IA # AI texto a voz

hace 1 año

049.6K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Conversión de voz basada en recuperación WebUI: un marco para la conversión de voz basada en recuperación | Simulación de voces cantadas en la vida real

Introducción general

Lista de funciones

Utilizar la ayuda

ReechoAI: plataforma de clonación instantánea y síntesis de voz con IA ultrafalsa

Chapta: plataforma de creación de audiocuentos y libros ilustrados basada en AIGC, con una gran coherencia de personajes de libros ilustrados.

Artículos relacionados

LiblibAI - Mile High: Use Stable Diffusion en línea gratis, ¡genere 200 imágenes al día gratis!

Beanbag Big Model 1.6 - Multimodal Deep Thinking Big Model del equipo Beanbag en WordPop

Logics-Parsing - Modelo de análisis sintáctico de documentos de código abierto Ali

PodLM: genere podcasts de audio multilingües de diálogos, páginas web o textos largos (de pago)

Sin comentarios

Últimas colecciones

Últimos artículos

Conversión de voz basada en recuperación WebUI: un marco para la conversión de voz basada en recuperación | Simulación de voces cantadas en la vida real

Introducción general

Lista de funciones

Utilizar la ayuda

ReechoAI: plataforma de clonación instantánea y síntesis de voz con IA ultrafalsa

Chapta: plataforma de creación de audiocuentos y libros ilustrados basada en AIGC, con una gran coherencia de personajes de libros ilustrados.

Artículos relacionados

LiblibAI - Mile High: Use Stable Diffusion en línea gratis, ¡genere 200 imágenes al día gratis!

Beanbag Big Model 1.6 - Multimodal Deep Thinking Big Model del equipo Beanbag en WordPop

Logics-Parsing - Modelo de análisis sintáctico de documentos de código abierto Ali

PodLM: genere podcasts de audio multilingües de diálogos, páginas web o textos largos (de pago)

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos