Chapta: plataforma de creación de audiocuentos y libros ilustrados basada en AIGC, con una gran coherencia de personajes de libros ilustrados.
Introducción general Chapta (Chapta) es una plataforma de creación de audiolibros basada en la tecnología de Contenidos Generados por Inteligencia Artificial (AIGC). El objetivo de la plataforma es ofrecer a los usuarios un entorno de creación que integre herramientas de edición de texto, imagen, sonido y vídeo a través de la tecnología AIGC más avanzada. Los usuarios pueden...
Conversión de voz basada en recuperación WebUI: un marco para la conversión de voz basada en recuperación | Simulación de voces cantadas en la vida real
WebUI de conversión de voz basado en VITS es un marco de conversión de voz basado en VITS fácil de usar que permite la conversión de voz entre cualquier altavoz, incluyendo covers de canciones y cambios de voz en tiempo real. Tiene bajo ...
ReechoAI: plataforma de clonación instantánea y síntesis de voz con IA ultrafalsa
Introducción completa Reecho AI (Reecho) es una plataforma de clonación instantánea y síntesis de voz de IA de ultra fidelidad que utiliza tecnología avanzada de IA para permitir a los usuarios crear y clonar rápidamente personajes de voz específicos cargando o grabando una muestra de audio. La plataforma permite crear muestras de audio a partir de...
Zide Speech: Plataforma inteligente de síntesis del habla|Clonación del habla
Introducción completa Zide Voice es una plataforma de síntesis de voz que utiliza tecnología avanzada de IA. Los usuarios sólo tienen que subir un fragmento de voz, que se puede complementar con texto para generar clips de voz realistas y emotivos. La plataforma está equipada con funciones como la personalización rápida de personajes, la generación de voz basada en la nube y la síntesis de voz antropomórfica. No es necesario descargar ningún software a través de...
VoiceCraft: herramienta de código abierto de clonación de voz sin muestras y conversión de texto a voz
Introducción completa VoiceCraft es una herramienta de código abierto para la edición del habla y la síntesis del habla sin muestras basada en el modelo de lenguaje del códec neural. Emplea un innovador método de generación de secuencias codificadas que permite realizar operaciones de inserción, eliminación y sustitución en secuencias de habla existentes para generar un habla editada natural y coherente....
Happy Scribe: Plataforma de transcripción de audio y subtitulación de vídeo | Software gratuito de subtitulación de vídeo
Happy Scribe Descripción general Happy Scribe ofrece servicios de transcripción de audio automatizada y manual para convertir audio a texto con gran precisión y compatibilidad con varios idiomas y formatos. Incluye un editor interactivo, herramientas de colaboración, múltiples formatos de exportación, traducción automática...
Whisper GPGPU: OpenAI Whisper en Windows|Whisperdesktop
Introducción general Whisper es un proyecto de código abierto de GitHub desarrollado por Const-me que se centra en la inferencia de alto rendimiento del modelo de reconocimiento automático del habla (ASR) Whisper de OpenAI mediante GPGPU. Este proyecto se basa en la licencia MPL-2.0...
Buzz: herramienta de traducción de transcripción de audio offline de código abierto | transcripción de voz IOS
Buzz Introducción general Buzz es un proyecto de código abierto creado por chidiwilliams que permite la transcripción y traducción offline de audio en ordenadores personales. El proyecto se basa en la tecnología Whisper de OpenAI, que permite a los usuarios no depender de una conexión a Internet para...
Deepgram: API de servicios para soluciones de reconocimiento y síntesis del habla de alta precisión
Descripción general Deepgram es una empresa especializada en tecnologías de reconocimiento de voz y procesamiento del lenguaje natural que ofrece potentes API de conversión de voz a texto y de texto a voz....
Seaweed AI: plataforma inteligente de síntesis y clonación de voz
Introducción completa Seaweed AI es un producto de doblaje inteligente que puede convertir texto en voz en línea, impulsado por la plataforma abierta Yun Zhisheng AI. Los usuarios pueden ayudarse a sí mismos para lograr la clonación de voz, y proporcionar AI pronunciadores de diferentes géneros, acentos e idiomas, y directamente doblar la voz después de introducir el texto. Puede doblar rápidamente...









