AI Texto a voz

Total 79 artículos
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: modelo base de procesamiento de audio y diálogo de código abierto

Introducción general Kimi-Audio es un modelo de base de audio de código abierto desarrollado por Moonshot AI, centrado en la comprensión, generación y diálogo de audio. Es compatible con una amplia gama de tareas de procesamiento de audio, como el reconocimiento del habla, el Q&A de audio y el reconocimiento de las emociones del habla. El modelo se ha probado en más de 130...
hace 3 meses
01.2K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: convertir artículos tecnológicos populares en podcasts de audio listos para escuchar

Introducción general Audibit es un proyecto de código abierto, la función principal es Hacker News, TechCrunch y otros artículos populares de tecnología convertidos automáticamente en podcasts de audio, para que los usuarios en el viaje, la aptitud, u ocupado al escuchar la información a través de la Web o móvil. El proyecto hace ...
hace 3 meses
01.1K
Dia:生成超现实多人对话的文本转语音模型

Dia: un modelo texto-voz para generar diálogos multijugador hiperrealistas

Introducción general Dia es un modelo de texto a voz (TTS) de código abierto desarrollado por Nari Labs y centrado en la generación de audio de diálogo hiperrealista. Transforma guiones de texto en diálogos realistas de varios caracteres en un solo proceso, admite el control de emociones y entonación, e incluso genera representaciones no verbales....
hace 4 meses
0987
Vapi:帮助开发者快速构建低延时语音助手

Vapi: ayuda a los desarrolladores a crear rápidamente asistentes de voz de baja latencia

Introducción completa Vapi es una plataforma de IA de voz para desarrolladores. Permite a los usuarios crear, probar y desplegar asistentes de voz de IA en cuestión de minutos, resolviendo el problema del desarrollo de aplicaciones de voz tradicionales, que requiere mucho tiempo y es difícil de escalar.Vapi proporciona herramientas e infraestructura completas para soportar conversaciones en tiempo real, aplicaciones de...
hace 4 meses
01.2K
集成多种先进语音合成服务的开源运营项目

Proyecto operativo de código abierto que integra múltiples servicios avanzados de síntesis de voz

Introducción general Open-VoiceCanvas es una plataforma de síntesis de voz de código abierto desarrollada por el equipo ItusiAI. Soporta más de 50 idiomas, y puede convertir texto en habla natural, así como clonar voces personalizadas subiendo audio. El proyecto integra Ope...
hace 4 meses
01.3K
Paper to Podcast:把学术论文转换为多人对话播客

De paper a podcast: cómo convertir trabajos académicos en podcasts de conversación entre varias personas

Introducción general Paper to Podcast es una herramienta de código abierto especializada en transformar trabajos de investigación académica en podcasts animados y entretenidos. Utiliza tecnología de inteligencia artificial para convertir un documento en formato PDF en un diálogo entre tres personajes (el anfitrión, el alumno y el experto) para...
hace 4 meses
01K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: un modelo ligero para sintetizar el habla china e inglesa

Introducción general MegaTTS3 es una herramienta de síntesis de voz de código abierto desarrollada por ByteDance en colaboración con la Universidad de Zhejiang, centrada en la generación de voz china e inglesa de alta calidad. Su modelo central tiene sólo 0,45 B de parámetros, es ligero y eficiente, admite la generación de habla mixta china e inglesa y la clonación del habla. El proyecto está alojado en ...
hace 4 meses
01.3K
Podcastle:快速创建高质量播客的AI工具

Podcastle: una herramienta de IA para crear rápidamente podcasts de alta calidad

Introducción general Podcastle es una plataforma en línea basada en IA que se especializa en ayudar a los usuarios a crear y editar rápidamente podcasts de alta calidad. Integra funciones de grabación, edición y publicación, y los usuarios pueden hacerlo todo a través de un navegador sin necesidad de equipos especializados ni software complejo. La plataforma utiliza ...
hace 4 meses
01.1K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks: convertir ebooks epub en audiolibros m4b

Introducción general Autiobooks es una herramienta de código abierto diseñada para ayudar a los usuarios a convertir rápidamente libros electrónicos en formato .epub a audiolibros en formato .m4b. Utiliza tecnología de síntesis de voz de alta calidad proporcionada por Kokoro para generar un audio natural y fluido. Esta herramienta fue desarrollada por...
hace 5 meses
01.2K
猫与星:和孩子一起编写专属童话故事的听故事APP

Cat & Star: una aplicación para escribir cuentos exclusivos con tu hijo

Introducción general "Cat & Star" (maoyuxing.com) es una plataforma interactiva de creación de cuentos diseñada para niños, que ayuda a padres e hijos a crear juntos cuentos de hadas personalizados a través de aplicaciones móviles. Los usuarios pueden introducir información como el nombre del niño y sus preferencias para generar contenidos de cuentos únicos....
hace 6 meses
01.4K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: una API unificada para integrar la generación de voz bien conocida, la transcripción de voz y el modelado de voz

Introducción general Orate es un conjunto de herramientas de IA centrado en la generación y transcripción de voz. Proporciona una API unificada que se integra a la perfección con los principales proveedores de IA, como OpenAI, ElevenLabs y AssemblyAI, para ayudar a...
hace 6 meses
01.9K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Pesos: una canción de imitación de voz y una plataforma de creación de texto a voz

Introducción general Weights es una plataforma social de creatividad que utiliza IA y que permite a los usuarios crear carátulas de voz, texto a voz, imágenes, música y vídeos con acciones sencillas. La plataforma proporciona una gran cantidad de herramientas y plantillas para ayudar a los usuarios a empezar a crear rápidamente y compartir con la comunidad desde...
hace 6 meses
02.3K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: convierta PDF en podcasts de herramientas de código abierto

Introducción general Open NotebookLM es un proyecto de código abierto diseñado para convertir cualquier documento PDF en un podcast. La herramienta utiliza modelos de código abierto Large Language Model (LLM) y Text-to-Speech (TTS) para procesar contenidos PDF y generar diálogos naturales adecuados para podcasts de audio....
hace 6 meses
01.7K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: un modelo de conversión de texto en habla de código abierto para la generación y clonación de habla de alta calidad

Introducción general Llasa-3B es un modelo de conversión de texto a voz (TTS) de código abierto desarrollado por el Laboratorio de Audio de la Universidad de Ciencia y Tecnología de Hong Kong (HKUST Audio). El modelo se basa en la arquitectura Llama 3.2B, que ha sido cuidadosamente ajustada para proporcionar una generación de voz de alta calidad que no sólo soporta múltiples...
hace 6 meses
01.8K
Jellypod:制作多语言AI播客,创建、编辑和分发AI播客

Jellypod: producción de podcasts multilingües sobre inteligencia artificial, creación, edición y distribución de podcasts sobre inteligencia artificial.

Introducción general Jellypod es un potente estudio de podcasts de AI diseñado para ayudar a los usuarios a crear, editar y publicar fácilmente podcasts de AI de alta calidad. Con Jellypod, los usuarios pueden diseñar anfitriones de podcast personalizados, refinar guiones y publicar podcasts a...
hace 7 meses
01.8K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: Generar audiolibros, convertir libros electrónicos en audiolibros con Kokoro

Introducción general Audiblez es un proyecto de código abierto diseñado para convertir libros electrónicos (por ejemplo, en formato .epub) en audiolibros (por ejemplo, en formato .m4b). El proyecto utiliza la tecnología de síntesis de voz de alta calidad de Kokoro para soportar múltiples idiomas y múltiples voces. Los usuarios pueden...
hace 7 meses
02K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust: plataformas de servicios en línea de generación de voz con inteligencia artificial y texto a voz (TTS)

Introducción general Acoust es una plataforma de servicios de generación de voz y texto a voz (TTS) de IA en línea que utiliza la última tecnología de IA para generar voz realista. La plataforma también proporciona potentes herramientas de edición de vídeo que permiten a los usuarios completar la producción de vídeo sin...
hace 7 meses
01.6K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Introducción general ebook2audiobook es una potente herramienta de conversión de ebooks a audiolibros de código abierto. Es capaz de convertir eBooks en múltiples formatos en audiolibros con marcadores de capítulos completos y metadatos. La herramienta utiliza Calibre para la conversión de formatos de e...
hace 7 meses
02.4K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI: Servicio de clonación de voz y síntesis de traducción multilingüe de audio y vídeo

Introducción completa ViiTor AI es una potente plataforma de inteligencia artificial centrada en ofrecer servicios de traducción de vídeo de alta calidad, clonación de voz, vídeos de avatares generados por IA y síntesis de voz. La plataforma es compatible con varios idiomas y tiene como objetivo ayudar a los usuarios a lograr fácilmente la creación de contenidos multilingües.ViiTo...
hace 8 meses
02.6K
Wondercraft:专注广告配音、多人有声读物和播客的文本转音频工具

Wondercraft: herramienta de conversión de texto a audio centrada en la locución de anuncios, audiolibros multijugador y podcasts.

Introducción general Wondercraft es una revolucionaria plataforma de creación de audio y vídeo basada en IA que ofrece a los creadores de contenidos una solución integral para la producción de audio y vídeo. Utilizando tecnología avanzada de IA, la plataforma es capaz de convertir contenido de texto en habla natural y fluida, soportando más de 20 idiomas....
hace 8 meses
01.8K
GizAI:全能AI助手,集成主流生成式AI工具,让每个人免费使用商业化AI工具

GizAI: asistente de inteligencia artificial todo en uno que integra las principales herramientas de inteligencia artificial generativa y pone a disposición de todos las herramientas comerciales de inteligencia artificial.

Introducción general GizAI es una plataforma integral con capacidades integradas de generación de IA, toma de notas y almacenamiento en la nube. Los usuarios pueden generar imágenes, vídeos, audios, textos, personajes, historias y juegos con GizAI, y pueden tomar notas colaborativas y almacenamiento en la nube en la plataforma.GizAI proporciona multi...
hace 8 meses
03K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: modelo experimental de conversión de texto en voz, TTS implementado mediante un enfoque de modelado lingüístico puro.

Introducción general OuteTTS es un modelo experimental de conversión de texto en habla (TTS) que utiliza un enfoque de modelado lingüístico puro para generar habla de alta calidad. A diferencia de los sistemas TTS tradicionales, OuteTTS no requiere adaptadores externos ni arquitecturas complejas. El modelo se basa en la arquitectura LLaMa...
hace 6 meses
01.8K
PodLM:将对话、网页或长文本生成多语言音频播客(付费)

PodLM: genere podcasts de audio multilingües de diálogos, páginas web o textos largos (de pago)

Introducción general PodLM es una plataforma de generación de podcast de IA de última generación diseñada para ayudar a los usuarios a convertir rápidamente texto, documentos o contenido de URL en audio de podcast de alta calidad. Al aprovechar la tecnología de IA de vanguardia, PodLM es capaz de generar automáticamente guiones de podcast estructurados y atractivos y...
hace 10 meses
02.1K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

SoniTranslate: Solución de código abierto para el doblaje de traducción de vídeo, doblaje múltiple, ajuste de velocidad e imitación del sonido original.

Descripción general SoniTranslate es una herramienta de doblaje multilingüe de vídeo potente y fácil de usar, diseñada para ofrecer una solución de traducción de vídeo y audio sincronizado. Utiliza tecnologías avanzadas de reconocimiento de voz y traducción automática para traducir contenidos de vídeo a varios idiomas y mantener el audio sincronizado. La ...
hace 10 meses
03.9K
逗哥配音:专注短视频解说、创作的智能配音神器

Teaser Dubbing: herramienta de doblaje inteligente centrada en la narración y creación de vídeos cortos

Introducción completa Tease Dubbing es un popular software de doblaje AI con más de 5 millones de usuarios. El software utiliza tecnología avanzada de doblaje inteligente AI para proporcionar efectos de doblaje profesionales y realistas, que es adecuado para vídeos cortos, producción de anuncios, educación y formación y otros escenarios. Teaser Dubbing se compromete a proporcionar a los usuarios...
hace 10 meses
01.8K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音

Doblaje de YouTube: traduzca vídeos de YouTube a diferentes idiomas y sincronice el doblaje en tiempo real

Introducción general El doblaje de YouTube es una plataforma de doblaje inteligente diseñada para ofrecer servicios de doblaje multilingüe a creadores y espectadores de vídeos. A través de la tecnología de IA, la plataforma es capaz de traducir y generar automáticamente doblajes de vídeos de YouTube, soportando múltiples idiomas y estilos de voz. Los usuarios sólo tienen que instalar...
hace 10 meses
01.9K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy: Herramienta de conversión de contenidos de múltiples fuentes a audio multilingüe, una alternativa de código abierto a las funciones de podcasting de NotebookLM.

Introducción general Podcastfy es un paquete Python de código abierto que utiliza la tecnología de Inteligencia Artificial Generativa (GenAI) para convertir contenidos web, archivos PDF, texto, imágenes, vídeos de youtube y muchas otras fuentes en...
hace 10 meses
01.8K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: una clave para generar audiolibros con calidad de sonido natural, compatible con PDF, epub, docx y otros formatos.

Introducción completa QuickPiperAudiobook es un proyecto de código abierto diseñado para convertir una variedad de formatos de texto (por ejemplo, epub, mobi, txt, PDF, HTML, etc) en audiolibros de sonido natural a través de un simple comando. La herramienta utiliza Pi...
hace 10 meses
01.5K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI: plataforma inteligente de síntesis y clonación de voz

Introducción completa Seaweed AI es un producto de doblaje inteligente que puede convertir texto en voz en línea, impulsado por la plataforma abierta Yun Zhisheng AI. Los usuarios pueden ayudarse a sí mismos para lograr la clonación de voz, y proporcionar AI pronunciadores de diferentes géneros, acentos e idiomas, y directamente doblar la voz después de introducir el texto. Puede doblar rápidamente...
hace 10 meses
02K
Descript:一站式视频与播客编辑,简单如编辑文档

Descript: Edición integral de vídeo y podcast, tan sencilla como editar un documento

Descript Descripción general Descript es una herramienta de edición de vídeo y podcasts potente pero fácil de usar. Tiene una precisión y velocidad de transcripción líderes en el sector y potentes herramientas de corrección, así como la capacidad de transcribir vídeo a texto con tecnología de IA y editar vídeo editando el texto. Además de...
hace 10 meses
02.1K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI: Plataforma de síntesis de voz de inteligencia artificial | Clonación de voz | Detección profunda de audio falso

Introducción general Resemble AI es una plataforma de síntesis de voz de inteligencia artificial diseñada para la empresa. La plataforma proporciona tecnología puntera de generación de voz mediante IA y detección profunda de audio falso para la futura seguridad de la información. Entre sus funciones se incluyen la clonación de voz, la detección profunda de audio falsificado en tiempo real, la tecnología de marca de agua de IA...
hace 10 meses
02K
Ondoku:在线文本朗读工具|文本转语音|图片转语音朗读

Ondoku: Lector de texto en línea|Lector de texto a voz|Lector de imagen a voz

Ondoku Introducción general Ondoku es un software de conversión de texto a voz en línea que permite a los usuarios introducir contenido de texto en el cuadro de texto proporcionado por el sitio web, y el software es capaz de convertir el artículo en una lectura de voz de acuerdo con las necesidades del usuario, y admite guardar la voz como un archivo de formato MP3. Este servicio es adecuado tanto para la escucha instantánea...
hace 10 meses
02K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: herramienta profesional de edición de audio en línea|producción de audiolibros|de texto a voz|separación de acompañamientos

Introducción general XAudioPro es una herramienta avanzada de edición y transcodificación de audio en tiempo real en línea que es a la vez profesional y portátil. Soporta funciones profesionales de edición de audio como cortar, recortar, copiar, borrar, restaurar y controlar la ganancia de amplitud. También ofrece servicios de eliminación de ruido, como reducción de ruido por sustracción espectral,...
hace 10 meses
01.7K
Hume AI:赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: Potenciación de la IA mediante el reconocimiento de emociones | Reconocimiento de estados emocionales a partir de sonidos y expresiones | Generación de discurso con estados emocionales

Introducción general Hume AI es una empresa de IA centrada en la inteligencia emocional, que desarrolla tecnologías de IA multimodal que comprenden las emociones humanas y responden a ellas. Su producto estrella, Empathic Voice Interface (EVI), es capaz de reconocer y responder a las...
hace 10 meses
01.7K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop: plataforma de creación de locuciones profesionales y narraciones de vídeos cortos | locución de persona real | clonar la voz | con un clic en una película

Introducción completa Magic Voice Workshop es una plataforma integral de doblaje de vídeos cortos y de IA con información sobre doblaje por software, doblaje real, bibliotecas de sonido, servicios de clonación y mucho más. La plataforma integra edición de audio, generación de copias de IA, edición de vídeo y herramientas de colaboración para servicios relacionados con el audio y la creación de contenidos. Los usuarios experimentan el editor de audio...
hace 10 meses
01.6K
Listnr:多语言AI语音生成器,变革性人声合成技术

Listnr: generador de voz multilingüe con inteligencia artificial, tecnología de síntesis de voz humana transformadora

Introducción general Listnr es un software de texto a voz con un motor de IA generativa que crea síntesis de voz en más de 1.000 voces diferentes en más de 142 idiomas, incluyendo la clonación de su propia voz. La plataforma da servicio a más de 1 millón de usuarios en vídeos cortos, YouTub...
hace 10 meses
01.5K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: música rap generada por inteligencia artificial y plataforma de clonación de voz | Text to Speech

Introducción general Uberduck AI es una plataforma innovadora que ofrece síntesis de IA de voces cantadas y habladas para agencias creativas, productores musicales y programadores. Los usuarios pueden elegir diferentes ritmos musicales, generar letras mediante IA o escribir las suyas propias, seleccionar sonidos específicos y, en definitiva, crear canciones de rap....
hace 11 meses
01.9K
NotebookLM:知识笔记检索阅读,多类文档生成语音对话播客

NotebookLM: Lectura de recuperación de notas de conocimiento, generación de documentos multiclase Podcasts de diálogo de voz

Introducción general NotebookLM es una herramienta de colaboración personalizada con IA de Google diseñada para ayudar a los usuarios a utilizar su mente al máximo. Los usuarios pueden cargar documentos y NotebookLM domina al instante el contenido de estas fuentes, facilitando la lectura...
hace 2 meses
02.2K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: Plataforma integral de procesamiento de audio/vídeo|Generación de vídeo|Subtítulos AI|Extracción de audio|Conversión de voz en texto

Introducción completa Record Cafe es una plataforma integral de procesamiento de audio/vídeo que proporciona servicios de diálogo de vídeo AI, subtítulos AI y conversión de voz a texto AI. Las funciones incluyen grabación de pantalla, edición de vídeo, conversión de GIF/audio, etc., y admite almacenamiento y uso compartido en la nube. La interfaz es intuitiva y fácil de usar, y también es compatible con la grabación multi-pantalla y multi-lenguaje inteligente ...
hace 8 meses
02.1K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: herramienta de conversión de texto a voz multilingüe (compatible con más de 7000 idiomas), rápida y controlable.

Introducción general IMS Toucan es un avanzado kit de herramientas de conversión de texto a voz (TTS) desarrollado por el Instituto de Procesamiento del Lenguaje Natural (IMS) de la Universidad de Stuttgart (Alemania). El kit de herramientas es compatible con más de 7000 idiomas y es rápido, controlable y requiere pocos recursos informáticos.IMS...
hace 6 meses
01.8K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS: un modelo de generación de voz que imita la voz de una persona real hablando (paquete de aceleración ChatTTS one-click)

Introducción general ChatTTS es un modelo generativo del habla diseñado para escenarios de diálogo. Genera un habla natural y expresiva, admite varios idiomas y varios hablantes, y es adecuado para diálogos interactivos. Para ello, el modelo predice y controla con precisión características rítmicas como la risa, las pausas y las interjecciones,...
hace 6 meses
02K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS: Herramienta gratuita de conversión de texto a voz en línea|Mejora de audio|Clips de audio

FreeTTS Descripción general FreeTTS es una herramienta gratuita de conversión de texto a voz en línea que permite a los usuarios convertir texto en archivos de voz con sonido natural. Con soporte para múltiples idiomas y opciones de sonido, los usuarios pueden convertir texto a formatos MP3, WAV, OGG y ACC...
hace 11 meses
02.8K
ElevenLabs:高质量AI语音生成平台,文字配音和语音克隆工具

ElevenLabs: plataforma de generación de voz de IA de alta calidad, herramienta de doblaje de texto y clonación de voz

Introducción general ElevenLabs es una startup con sede en Nueva York, EE.UU., especializada en el campo de la IA generativa del habla. La empresa ofrece una gama de potentes servicios para el habla generada por texto, el habla generada por voz, la clonación del habla y el reconocimiento del habla.ElevenLabs destaca en...
hace 11 meses
02.2K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: kit de herramientas de voz AI para implantación local

Introducción exhaustiva Easy-Voice-Toolkit es un conjunto de herramientas multifuncionales basado en el Open Source Speech Project, que proporciona una amplia gama de herramientas de audio automatizadas para el reconocimiento del habla, la transcripción del habla, la conversión del habla, la creación de conjuntos de datos y el entrenamiento de modelos. Los usuarios pueden utilizar estas herramientas de forma selectiva según sus necesidades...
hace 11 meses
02K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人

DupDub: editor de vídeo con inteligencia artificial | doblaje | traducción de vídeo | digitalizador de fotos

Descripción general Dupdub es una plataforma de creación de podcasts y presentaciones de vídeo que ofrece una serie de herramientas de IA para apoyar la creatividad de los usuarios. Sus funciones abarcan la creación de texto a vídeo, ofreciendo servicios de doblaje de voz y vídeo con IA, así como edición de vídeo, transcripción y subtitulación. Dupdub es también ...
hace 12 meses
01.8K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: Genera Videos Digitales de Habla Humana con Sólo una Foto, Múltiples Herramientas Gratuitas de Generación de Video

Descripción General Vidnoz es una plataforma gratuita de generación de vídeos AI para crear rápidamente vídeos AI en menos de 1 minuto. No requiere coste, descarga ni experiencia. La plataforma ofrece más de 500 avatares AI, más de 470 locuciones AI realistas y más de 500 plantillas. Con Vidnoz AI video...
hace 12 meses
02.4K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: Cliente nativo de vídeo a subtítulos, conversión de subtítulos multilingües

Descripción general MemoAI es una potente herramienta de traducción de vídeo diseñada para convertir archivos de vídeo y audio en texto, subtítulos y notas. Ya sea un vídeo de YouTube, un podcast o un archivo local, MemoAI puede manejarlo con facilidad. Es compatible con más de 90 idiomas como chino, inglés, japonés...
hace 8 meses
02.5K
腾讯智影:智能视频创作工具|AI数字人、动漫生成套件

Tencent Smart Shadow: herramienta inteligente de creación de vídeo | AI Digital Man, kit de generación de anime

Introducción Tencent Smart Shadow es una plataforma de creación de vídeo inteligente en línea lanzada por Tencent, que puede soportar el doblaje de texto, la transmisión humana digital, el reconocimiento automático de subtítulos y otras funciones a través de potentes herramientas de IA proporcionadas por servicios en la nube.
hace 1 año
02.3K
音剪:喜马拉雅自然人声、多人旁白音频创作平台

Recorte de sonido: voz humana natural de Himalaya, plataforma de creación de audio con varios narradores

Introducción completa Himalaya Audio Editor es una plataforma completa de creación de audio AI. Ofrece potentes funciones que ayudan a los usuarios con la producción de podcast de nivel profesional, grabación multipista, edición de audio, y la capacidad de convertir texto a voz. La plataforma también contiene múltiples opciones para voz profesional, ayudando a los usuarios...
hace 1 año
02.3K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: generación de modelos de conversión de texto en voz específicos para cada hablante a partir de un texto de entrada

Introducción general Parler-TTS es una biblioteca de modelos de texto a voz (TTS) de código abierto desarrollada por Hugging Face, diseñada para generar habla de alta calidad y sonido natural. El modelo es capaz de generar habla a partir de un texto de entrada con un estilo de locutor específico (por ejemplo, género, tono, estilo de habla...
hace 6 meses
01.6K