Clonación de voz por IA

Total 41 artículos
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: un modelo ligero para sintetizar el habla china e inglesa

Introducción general MegaTTS3 es una herramienta de síntesis de voz de código abierto desarrollada por ByteDance en colaboración con la Universidad de Zhejiang, centrada en la generación de voz china e inglesa de alta calidad. Su modelo central tiene sólo 0,45 B de parámetros, es ligero y eficiente, admite la generación de habla mixta china e inglesa y la clonación del habla. El proyecto está alojado en ...
hace 5 meses
012.5K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC: admite la conversión en tiempo real de voz y canciones con menos muestras.

Introducción general Seed-VC es un proyecto de código abierto en GitHub, desarrollado por Plachtaa. Puede utilizar una pieza de 1 a 30 segundos de audio de referencia , el habla rápida o la conversión de canciones , sin formación adicional . El proyecto soporta la conversión de voz en tiempo real , retraso ...
hace 5 meses
019.7K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: un marco de interacción multimodal por voz que reconoce el habla y se comunica mediante habla clonada, entre otras funciones.

Introducción completa Step-Audio es un marco de interacción del habla inteligente de código abierto diseñado para proporcionar capacidades de comprensión y generación del habla listas para usar en entornos de producción. El marco admite conversaciones en varios idiomas (por ejemplo, chino, inglés, japonés), habla emocional (por ejemplo, feliz, triste), dialectos regionales (por ejemplo, cantonés, szechuan ...
hace 6 meses
012.6K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Pesos: una canción de imitación de voz y una plataforma de creación de texto a voz

Introducción general Weights es una plataforma social de creatividad que utiliza IA y que permite a los usuarios crear carátulas de voz, texto a voz, imágenes, música y vídeos con acciones sencillas. La plataforma proporciona una gran cantidad de herramientas y plantillas para ayudar a los usuarios a empezar a crear rápidamente y compartir con la comunidad desde...
hace 7 meses
015.6K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: un modelo de conversión de texto en habla de código abierto para la generación y clonación de habla de alta calidad

Introducción general Llasa-3B es un modelo de conversión de texto a voz (TTS) de código abierto desarrollado por el Laboratorio de Audio de la Universidad de Ciencia y Tecnología de Hong Kong (HKUST Audio). El modelo se basa en la arquitectura Llama 3.2B, que ha sido cuidadosamente ajustada para proporcionar una generación de voz de alta calidad que no sólo soporta múltiples...
hace 7 meses
012.8K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Introducción exhaustiva Fish Speech Derivative Project Fish Agent es un revolucionario sistema de clonación del habla AI de extremo a extremo desarrollado en base a la arquitectura modelo V0.1 3B. Como sistema de procesamiento de clonación del habla de extremo a extremo, su característica más importante es el uso de...
hace 8 meses
012.5K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI: Servicio de clonación de voz y síntesis de traducción multilingüe de audio y vídeo

Introducción completa ViiTor AI es una potente plataforma de inteligencia artificial centrada en ofrecer servicios de traducción de vídeo de alta calidad, clonación de voz, vídeos de avatares generados por IA y síntesis de voz. La plataforma es compatible con varios idiomas y tiene como objetivo ayudar a los usuarios a lograr fácilmente la creación de contenidos multilingües.ViiTo...
hace 8 meses
016.6K
趣丸千音:语音克隆并结合口型同步,一键翻译视频为多语言!

Funky Maru Chiyo: ¡clonación de voz y combinación con sincronización bucal para traducir vídeos a varios idiomas con un solo clic!

Introducción completa Funmaru Thousand Voices es una plataforma multilingüe de síntesis de voz AI que proporciona soluciones de generación de voz realistas y naturales. Los usuarios pueden convertir fácilmente contenido de texto en audio de calidad profesional y apoyar la creación de voces AI exclusivas (clones de voz) a partir de cero muestras para satisfacer necesidades personalizadas. La plataforma también ofrece funciones de traducción de vídeo para...
hace 9 meses
010.9K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: Ali lanza un proyecto de código abierto de clonación de voz en 3 segundos con soporte para etiquetas controladas emocionalmente.

Introducción CosyVoice es un modelo multilingüe de generación de voz a gran escala que ofrece capacidades completas, desde la inferencia y el entrenamiento hasta el despliegue. Desarrollado por el equipo FunAudioLLM, su objetivo es lograr un habla de alta calidad mediante transformadores autorregresivos avanzados y modelos de difusión basados en ODE....
hace 7 meses
029.5K
海螺AI视频生成器:文本或图像生成高质量视频,影视级镜头创作

Generador de vídeo Conch AI: texto o imagen para generar vídeo de alta calidad, creación de secuencias para cine y TV

Introducción General Conch AI Video Generator es una herramienta avanzada de generación de vídeo AI desarrollada por MiniMax. Los usuarios sólo tienen que proporcionar una descripción de texto simple o subir imágenes, y Conch AI puede generar rápidamente contenido de vídeo de alta calidad. La herramienta es ampliamente utilizada por creadores,...
hace 9 meses
013.2K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS): un conjunto de herramientas de aprendizaje profundo para la generación de texto a voz con soporte multilingüe y capacidades de clonación de voz.

Introducción exhaustiva Coqui TTS es un kit de herramientas avanzado de generación de texto a voz (TTS) de código abierto basado en técnicas de aprendizaje profundo. Se ha puesto a prueba tanto en entornos de investigación como de producción, y ofrece un amplio conjunto de funciones y modelos que admiten la conversión de texto a voz en varios idiomas.Coqui TTS...
hace 7 meses
012.5K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: clonación de voz rápida y formación de modelos, conversión de texto a voz basada en xtts v2

Introducción completa MockingBird es un proyecto de código abierto que pretende conseguir una rápida clonación de voz y conversión de texto a voz mediante tecnología de IA. Los usuarios sólo tienen que proporcionar 5 segundos de muestras de voz, puede generar cualquier contenido de voz. El proyecto admite una gran variedad de conjuntos de datos chinos ...
hace 9 meses
012.6K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: herramienta de clonación de voz multilingüe y sin muestras basada en xtts_v2 para Windows.

Descripción general Clone Voice es una herramienta de clonación de sonido de código abierto que proporciona una interfaz basada en web que permite a los usuarios clonar voces utilizando cualquier sonido o grabación de voz personal. La herramienta es fácil de usar, incluso sin una GPU NVIDIA, y se puede utilizar con una aplicación precompilada...
hace 11 meses
011.9K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

Conversión de voz basada en recuperación WebUI: un marco para la conversión de voz basada en recuperación | Simulación de voces cantadas en la vida real

WebUI de conversión de voz basado en VITS es un marco de conversión de voz basado en VITS fácil de usar que permite la conversión de voz entre cualquier altavoz, incluyendo covers de canciones y cambios de voz en tiempo real. Tiene bajo ...
hace 11 meses
014.4K
ReechoAI(睿声):超拟真AI语音合成与瞬时克隆平台

ReechoAI: plataforma de clonación instantánea y síntesis de voz con IA ultrafalsa

Introducción completa Reecho AI (Reecho) es una plataforma de clonación instantánea y síntesis de voz de IA de ultra fidelidad que utiliza tecnología avanzada de IA para permitir a los usuarios crear y clonar rápidamente personajes de voz específicos cargando o grabando una muestra de audio. La plataforma permite crear muestras de audio a partir de...
hace 11 meses
013K
自得语音:智能语音合成平台|语音克隆

Zide Speech: Plataforma inteligente de síntesis del habla|Clonación del habla

Introducción completa Zide Voice es una plataforma de síntesis de voz que utiliza tecnología avanzada de IA. Los usuarios sólo tienen que subir un fragmento de voz, que se puede complementar con texto para generar clips de voz realistas y emotivos. La plataforma está equipada con funciones como la personalización rápida de personajes, la generación de voz basada en la nube y la síntesis de voz antropomórfica. No es necesario descargar ningún software a través de...
hace 11 meses
011.5K
VoiceCraft:开源零样本语音克隆与文本转语音工具

VoiceCraft: herramienta de código abierto de clonación de voz sin muestras y conversión de texto a voz

Introducción completa VoiceCraft es una herramienta de código abierto para la edición del habla y la síntesis del habla sin muestras basada en el modelo de lenguaje del códec neural. Emplea un innovador método de generación de secuencias codificadas que permite realizar operaciones de inserción, eliminación y sustitución en secuencias de habla existentes para generar un habla editada natural y coherente....
hace 11 meses
010.9K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI: plataforma inteligente de síntesis y clonación de voz

Introducción completa Seaweed AI es un producto de doblaje inteligente que puede convertir texto en voz en línea, impulsado por la plataforma abierta Yun Zhisheng AI. Los usuarios pueden ayudarse a sí mismos para lograr la clonación de voz, y proporcionar AI pronunciadores de diferentes géneros, acentos e idiomas, y directamente doblar la voz después de introducir el texto. Puede doblar rápidamente...
hace 11 meses
010.7K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI: Plataforma de síntesis de voz de inteligencia artificial | Clonación de voz | Detección profunda de audio falso

Introducción general Resemble AI es una plataforma de síntesis de voz de inteligencia artificial diseñada para la empresa. La plataforma proporciona tecnología puntera de generación de voz mediante IA y detección profunda de audio falso para la futura seguridad de la información. Entre sus funciones se incluyen la clonación de voz, la detección profunda de audio falsificado en tiempo real, la tecnología de marca de agua de IA...
hace 11 meses
010.8K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop: plataforma de creación de locuciones profesionales y narraciones de vídeos cortos | locución de persona real | clonar la voz | con un clic en una película

Introducción completa Magic Voice Workshop es una plataforma integral de doblaje de vídeos cortos y de IA con información sobre doblaje por software, doblaje real, bibliotecas de sonido, servicios de clonación y mucho más. La plataforma integra edición de audio, generación de copias de IA, edición de vídeo y herramientas de colaboración para servicios relacionados con el audio y la creación de contenidos. Los usuarios experimentan el editor de audio...
hace 11 meses
011.6K
Listnr:多语言AI语音生成器,变革性人声合成技术

Listnr: generador de voz multilingüe con inteligencia artificial, tecnología de síntesis de voz humana transformadora

Introducción general Listnr es un software de texto a voz con un motor de IA generativa que crea síntesis de voz en más de 1.000 voces diferentes en más de 142 idiomas, incluyendo la clonación de su propia voz. La plataforma da servicio a más de 1 millón de usuarios en vídeos cortos, YouTub...
hace 11 meses
012.3K
度加:文案一键成片,急速克隆声音和剪辑精彩片段

Degree Plus: Copiar en una película con un clic, clonar el sonido y editar lo más destacado en un santiamén

Introducción exhaustiva Duga Creation Tool es una plataforma de creación de AIGC (contenidos generados por inteligencia artificial) lanzada por Baidu con el objetivo de reducir el umbral de generación de contenidos y mejorar la eficiencia de la creación a través de la tecnología de IA. La plataforma agrega las múltiples capacidades AIGC de Baidu para ofrecer un servicio de creación integral, desde la inspiración hasta el producto final. El principal ...
hace 11 meses
011.3K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: música rap generada por inteligencia artificial y plataforma de clonación de voz | Text to Speech

Introducción general Uberduck AI es una plataforma innovadora que ofrece síntesis de IA de voces cantadas y habladas para agencias creativas, productores musicales y programadores. Los usuarios pueden elegir diferentes ritmos musicales, generar letras mediante IA o escribir las suyas propias, seleccionar sonidos específicos y, en definitiva, crear canciones de rap....
hace 11 meses
012.6K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: revolucionarias herramientas de generación y clonación de voz

Introducción general GPT-SoVITS es una herramienta de conversión y síntesis de voz de código abierto que combina el modelo GPT y la tecnología de cambio de voz SoVITS. La herramienta admite la conversión de texto a voz sobre la marcha con cero y pocas muestras, y la migración de estilo de voz con sólo 5 segundos de muestras de audio. Entre sus funciones se incluyen la ...
hace 11 meses
012.1K
ElevenLabs:高质量AI语音生成平台,文字配音和语音克隆工具

ElevenLabs: plataforma de generación de voz de IA de alta calidad, herramienta de doblaje de texto y clonación de voz

Introducción general ElevenLabs es una startup con sede en Nueva York, EE.UU., especializada en el campo de la IA generativa del habla. La empresa ofrece una gama de potentes servicios para el habla generada por texto, el habla generada por voz, la clonación del habla y el reconocimiento del habla.ElevenLabs destaca en...
hace 12 meses
012.1K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: kit de herramientas de voz AI para implantación local

Introducción exhaustiva Easy-Voice-Toolkit es un conjunto de herramientas multifuncionales basado en el Open Source Speech Project, que proporciona una amplia gama de herramientas de audio automatizadas para el reconocimiento del habla, la transcripción del habla, la conversión del habla, la creación de conjuntos de datos y el entrenamiento de modelos. Los usuarios pueden utilizar estas herramientas de forma selectiva según sus necesidades...
hace 12 meses
011.5K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: Genera Videos Digitales de Habla Humana con Sólo una Foto, Múltiples Herramientas Gratuitas de Generación de Video

Descripción General Vidnoz es una plataforma gratuita de generación de vídeos AI para crear rápidamente vídeos AI en menos de 1 minuto. No requiere coste, descarga ni experiencia. La plataforma ofrece más de 500 avatares AI, más de 470 locuciones AI realistas y más de 500 plantillas. Con Vidnoz AI video...
hace 1 año
013.8K
Rask AI:视频多语言翻译与专业语音克隆,视频本地化工具

Rask AI: Traducción multilingüe de vídeo con clonación profesional de voz, herramienta de localización de vídeo

Introducción general Rask AI es una plataforma inteligente de localización de vídeo diseñada para proporcionar soluciones rápidas de producción de audio y vídeo a creadores, educadores y empresas globales. La plataforma admite la traducción automática de vídeo y audio a más de 130 idiomas para ayudar a los usuarios a expandirse en los mercados globales. Entre sus funciones especiales se incluye la...
hace 1 año
011.7K
有道数字人:虚拟形象播报与实时交互平台|免费制作克隆数字人

Arigatou Digital Human: Plataforma de difusión de imágenes virtuales e interacción en tiempo real|Creación de humanos digitales clónicos gratuitos

Presentación exhaustiva Wealth Digital People es una plataforma que integra tecnología avanzada de IA y se centra en ofrecer servicios de difusión de imágenes virtuales e interactivos en tiempo real. La plataforma utiliza tecnologías propias de reconocimiento del habla, síntesis del habla, percepción multimodal y búsqueda y respuesta de documentos para crear un doble humano digital realista para que los usuarios puedan...
hace 1 año
010.4K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice (MyShell): Clonación instantánea de voz en varios idiomas con menos muestras

Introducción general OpenVoice es un método versátil de clonación instantánea del habla que permite copiar la voz de un locutor de referencia y generar habla multilingüe utilizando sólo breves clips de audio del locutor. Además de copiar tonos, OpenVoice permite controlar con precisión el estilo de la voz,...
hace 10 meses
021.1K