Clonación de voz por IA

共 41 篇文章
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: un modelo ligero para sintetizar el habla china e inglesa

Introducción general MegaTTS3 es una herramienta de síntesis de voz de código abierto desarrollada por ByteDance en colaboración con la Universidad de Zhejiang, centrada en la generación de voz china e inglesa de alta calidad. Su modelo central tiene sólo 0,45 B de parámetros, es ligero y eficiente, admite la generación de habla mixta china e inglesa y la clonación del habla. El proyecto está alojado en ...
hace 4 meses
01.3K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: un marco de interacción multimodal por voz que reconoce el habla y se comunica mediante habla clonada, entre otras funciones.

Introducción completa Step-Audio es un marco de interacción del habla inteligente de código abierto diseñado para proporcionar capacidades de comprensión y generación del habla listas para usar en entornos de producción. El marco admite conversaciones en varios idiomas (por ejemplo, chino, inglés, japonés), habla emocional (por ejemplo, feliz, triste), dialectos regionales (por ejemplo, cantonés, szechuan ...
hace 6 meses
02K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Pesos: una canción de imitación de voz y una plataforma de creación de texto a voz

Introducción general Weights es una plataforma social de creatividad que utiliza IA y que permite a los usuarios crear carátulas de voz, texto a voz, imágenes, música y vídeos con acciones sencillas. La plataforma proporciona una gran cantidad de herramientas y plantillas para ayudar a los usuarios a empezar a crear rápidamente y compartir con la comunidad desde...
hace 6 meses
02.3K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: un modelo de conversión de texto en habla de código abierto para la generación y clonación de habla de alta calidad

Introducción general Llasa-3B es un modelo de conversión de texto a voz (TTS) de código abierto desarrollado por el Laboratorio de Audio de la Universidad de Ciencia y Tecnología de Hong Kong (HKUST Audio). El modelo se basa en la arquitectura Llama 3.2B, que ha sido cuidadosamente ajustada para proporcionar una generación de voz de alta calidad que no sólo soporta múltiples...
hace 6 meses
01.8K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Introducción exhaustiva Fish Speech Derivative Project Fish Agent es un revolucionario sistema de clonación del habla AI de extremo a extremo desarrollado en base a la arquitectura modelo V0.1 3B. Como sistema de procesamiento de clonación del habla de extremo a extremo, su característica más importante es el uso de...
hace 7 meses
02.1K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI: Servicio de clonación de voz y síntesis de traducción multilingüe de audio y vídeo

Introducción completa ViiTor AI es una potente plataforma de inteligencia artificial centrada en ofrecer servicios de traducción de vídeo de alta calidad, clonación de voz, vídeos de avatares generados por IA y síntesis de voz. La plataforma es compatible con varios idiomas y tiene como objetivo ayudar a los usuarios a lograr fácilmente la creación de contenidos multilingües.ViiTo...
hace 8 meses
02.7K
趣丸千音:语音克隆并结合口型同步,一键翻译视频为多语言!

Funky Maru Chiyo: ¡clonación de voz y combinación con sincronización bucal para traducir vídeos a varios idiomas con un solo clic!

Introducción completa Funmaru Thousand Voices es una plataforma multilingüe de síntesis de voz AI que proporciona soluciones de generación de voz realistas y naturales. Los usuarios pueden convertir fácilmente contenido de texto en audio de calidad profesional y apoyar la creación de voces AI exclusivas (clones de voz) a partir de cero muestras para satisfacer necesidades personalizadas. La plataforma también ofrece funciones de traducción de vídeo para...
hace 8 meses
01.9K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: Ali lanza un proyecto de código abierto de clonación de voz en 3 segundos con soporte para etiquetas controladas emocionalmente.

Introducción CosyVoice es un modelo multilingüe de generación de voz a gran escala que ofrece capacidades completas, desde la inferencia y el entrenamiento hasta el despliegue. Desarrollado por el equipo FunAudioLLM, su objetivo es lograr un habla de alta calidad mediante transformadores autorregresivos avanzados y modelos de difusión basados en ODE....
hace 6 meses
03.5K
海螺AI视频生成器:文本或图像生成高质量视频,影视级镜头创作

Generador de vídeo Conch AI: texto o imagen para generar vídeo de alta calidad, creación de secuencias para cine y TV

Introducción General Conch AI Video Generator es una herramienta avanzada de generación de vídeo AI desarrollada por MiniMax. Los usuarios sólo tienen que proporcionar una descripción de texto simple o subir imágenes, y Conch AI puede generar rápidamente contenido de vídeo de alta calidad. La herramienta es ampliamente utilizada por creadores,...
hace 8 meses
02.1K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS): un conjunto de herramientas de aprendizaje profundo para la generación de texto a voz con soporte multilingüe y capacidades de clonación de voz.

Introducción exhaustiva Coqui TTS es un kit de herramientas avanzado de generación de texto a voz (TTS) de código abierto basado en técnicas de aprendizaje profundo. Se ha puesto a prueba tanto en entornos de investigación como de producción, y ofrece un amplio conjunto de funciones y modelos que admiten la conversión de texto a voz en varios idiomas.Coqui TTS...
hace 6 meses
02K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: herramienta de clonación de voz multilingüe y sin muestras basada en xtts_v2 para Windows.

Descripción general Clone Voice es una herramienta de clonación de sonido de código abierto que proporciona una interfaz basada en web que permite a los usuarios clonar voces utilizando cualquier sonido o grabación de voz personal. La herramienta es fácil de usar, incluso sin una GPU NVIDIA, y se puede utilizar con una aplicación precompilada...
hace 10 meses
02.1K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI: plataforma inteligente de síntesis y clonación de voz

Introducción completa Seaweed AI es un producto de doblaje inteligente que puede convertir texto en voz en línea, impulsado por la plataforma abierta Yun Zhisheng AI. Los usuarios pueden ayudarse a sí mismos para lograr la clonación de voz, y proporcionar AI pronunciadores de diferentes géneros, acentos e idiomas, y directamente doblar la voz después de introducir el texto. Puede doblar rápidamente...
hace 10 meses
02K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI: Plataforma de síntesis de voz de inteligencia artificial | Clonación de voz | Detección profunda de audio falso

Introducción general Resemble AI es una plataforma de síntesis de voz de inteligencia artificial diseñada para la empresa. La plataforma proporciona tecnología puntera de generación de voz mediante IA y detección profunda de audio falso para la futura seguridad de la información. Entre sus funciones se incluyen la clonación de voz, la detección profunda de audio falsificado en tiempo real, la tecnología de marca de agua de IA...
hace 10 meses
02K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop: plataforma de creación de locuciones profesionales y narraciones de vídeos cortos | locución de persona real | clonar la voz | con un clic en una película

Introducción completa Magic Voice Workshop es una plataforma integral de doblaje de vídeos cortos y de IA con información sobre doblaje por software, doblaje real, bibliotecas de sonido, servicios de clonación y mucho más. La plataforma integra edición de audio, generación de copias de IA, edición de vídeo y herramientas de colaboración para servicios relacionados con el audio y la creación de contenidos. Los usuarios experimentan el editor de audio...
hace 10 meses
01.6K
Listnr:多语言AI语音生成器,变革性人声合成技术

Listnr: generador de voz multilingüe con inteligencia artificial, tecnología de síntesis de voz humana transformadora

Introducción general Listnr es un software de texto a voz con un motor de IA generativa que crea síntesis de voz en más de 1.000 voces diferentes en más de 142 idiomas, incluyendo la clonación de su propia voz. La plataforma da servicio a más de 1 millón de usuarios en vídeos cortos, YouTub...
hace 10 meses
01.5K
度加:文案一键成片,急速克隆声音和剪辑精彩片段

Degree Plus: Copiar en una película con un clic, clonar el sonido y editar lo más destacado en un santiamén

Introducción exhaustiva Duga Creation Tool es una plataforma de creación de AIGC (contenidos generados por inteligencia artificial) lanzada por Baidu con el objetivo de reducir el umbral de generación de contenidos y mejorar la eficiencia de la creación a través de la tecnología de IA. La plataforma agrega las múltiples capacidades AIGC de Baidu para ofrecer un servicio de creación integral, desde la inspiración hasta el producto final. El principal ...
hace 11 meses
01.8K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: música rap generada por inteligencia artificial y plataforma de clonación de voz | Text to Speech

Introducción general Uberduck AI es una plataforma innovadora que ofrece síntesis de IA de voces cantadas y habladas para agencias creativas, productores musicales y programadores. Los usuarios pueden elegir diferentes ritmos musicales, generar letras mediante IA o escribir las suyas propias, seleccionar sonidos específicos y, en definitiva, crear canciones de rap....
hace 11 meses
02K
ElevenLabs:高质量AI语音生成平台,文字配音和语音克隆工具

ElevenLabs: plataforma de generación de voz de IA de alta calidad, herramienta de doblaje de texto y clonación de voz

Introducción general ElevenLabs es una startup con sede en Nueva York, EE.UU., especializada en el campo de la IA generativa del habla. La empresa ofrece una gama de potentes servicios para el habla generada por texto, el habla generada por voz, la clonación del habla y el reconocimiento del habla.ElevenLabs destaca en...
hace 11 meses
02.2K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: kit de herramientas de voz AI para implantación local

Introducción exhaustiva Easy-Voice-Toolkit es un conjunto de herramientas multifuncionales basado en el Open Source Speech Project, que proporciona una amplia gama de herramientas de audio automatizadas para el reconocimiento del habla, la transcripción del habla, la conversión del habla, la creación de conjuntos de datos y el entrenamiento de modelos. Los usuarios pueden utilizar estas herramientas de forma selectiva según sus necesidades...
hace 11 meses
02.1K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: Genera Videos Digitales de Habla Humana con Sólo una Foto, Múltiples Herramientas Gratuitas de Generación de Video

Descripción General Vidnoz es una plataforma gratuita de generación de vídeos AI para crear rápidamente vídeos AI en menos de 1 minuto. No requiere coste, descarga ni experiencia. La plataforma ofrece más de 500 avatares AI, más de 470 locuciones AI realistas y más de 500 plantillas. Con Vidnoz AI video...
hace 12 meses
02.4K
有道数字人:虚拟形象播报与实时交互平台|免费制作克隆数字人

Arigatou Digital Human: Plataforma de difusión de imágenes virtuales e interacción en tiempo real|Creación de humanos digitales clónicos gratuitos

综合介绍 有道数字人是一个集成了先进AI技术的平台,专注于提供虚拟形象播报和实时交互服务。平台利用自研的语音识别、语音合成、多模态感知和文档问答技术,为用户打造逼真的数字人分身,支持视频制作、翻译、教...
hace 12 meses
01.9K