AI Texto a voz

Total 79 artículos

ordenar

Muyan-TTS: síntesis y entrenamiento del habla en podcasts personalizados

Synthesis Muyan-TTS es un modelo de texto a voz (TTS) de código abierto diseñado para podcasts. Está preentrenado con más de 100.000 horas de datos de audio de podcasts y admite la síntesis de voz de muestra cero para generar voz natural de alta calidad. El modelo se basa en Llama-3.2-3...

hace 11 meses

072.3K

Kimi-Audio: modelo base de procesamiento de audio y diálogo de código abierto

Introducción general Kimi-Audio es un modelo de base de audio de código abierto desarrollado por Moonshot AI, centrado en la comprensión, generación y diálogo de audio. Es compatible con una amplia gama de tareas de procesamiento de audio, como el reconocimiento del habla, el Q&A de audio y el reconocimiento de las emociones del habla. El modelo se ha probado en más de 130...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # AI Voz a texto

hace 11 meses

0126K

Audibit: convertir artículos tecnológicos populares en podcasts de audio listos para escuchar

Introducción general Audibit es un proyecto de código abierto, la función principal es Hacker News, TechCrunch y otros artículos populares de tecnología convertidos automáticamente en podcasts de audio, para que los usuarios en el viaje, la aptitud, u ocupado al escuchar la información a través de la Web o móvil. El proyecto hace ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 11 meses

053.4K

Dia: un modelo texto-voz para generar diálogos multijugador hiperrealistas

Introducción general Dia es un modelo de texto a voz (TTS) de código abierto desarrollado por Nari Labs y centrado en la generación de audio de diálogo hiperrealista. Transforma guiones de texto en diálogos realistas de varios caracteres en un solo proceso, admite el control de emociones y entonación, e incluso genera representaciones no verbales....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 12 meses

076.4K

Orpheus-TTS: herramienta de conversión de texto a voz para generar habla china natural

Introducción general Orpheus-TTS es un sistema de texto a voz (TTS) de código abierto desarrollado sobre la arquitectura Llama-3b con el objetivo de generar audio cercano al habla humana natural. Está lanzado por el equipo Canopy AI y es compatible con inglés, español, francés...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

092.5K

ElevenLabs MCP: Servicio MCP de generación de voz

Introducción general ElevenLabs MCP es un proyecto oficial de código abierto de ElevenLabs alojado en GitHub. Es un servicio basado en el Protocolo de Control de Modelos (Model Context Protocol, MCP)....

Últimos recursos sobre IA # AI texto a voz Servicios MCP #

hace 1 año

059.6K

Vapi: ayuda a los desarrolladores a crear rápidamente asistentes de voz de baja latencia

Introducción completa Vapi es una plataforma de IA de voz para desarrolladores. Permite a los usuarios crear, probar y desplegar asistentes de voz de IA en cuestión de minutos, resolviendo el problema del desarrollo de aplicaciones de voz tradicionales, que requiere mucho tiempo y es difícil de escalar.Vapi proporciona herramientas e infraestructura completas para soportar conversaciones en tiempo real, aplicaciones de...

Últimos recursos sobre IA # AI Servicios abiertos # AI texto a voz

hace 1 año

071.7K

Conch Speech (MiniMax Audio): herramienta de inteligencia artificial para generar habla natural

Introducción completa MiniMax Audio es una herramienta de generación de voz AI de MiniMax, cuya característica principal es convertir rápidamente texto en voz natural con alta similitud. Se basa en el modelo Speech-02, con una similitud de síntesis del habla de hasta el 99...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI

hace 10 meses

0132.4K

Text2Voice: una interfaz gráfica de texto a voz basada en API de flujo de silicio

Introducción general Text2Voice es una herramienta de código abierto que proporciona funcionalidad de texto a voz basada en una API de movilidad basada en silicio, con una interfaz gráfica de usuario (GUI) limpia como su mejor característica. Fue creada por el desarrollador Sheldon Lee en GitHub para permitir...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

058K

Proyecto operativo de código abierto que integra múltiples servicios avanzados de síntesis de voz

Introducción general Open-VoiceCanvas es una plataforma de síntesis de voz de código abierto desarrollada por el equipo ItusiAI. Soporta más de 50 idiomas, y puede convertir texto en habla natural, así como clonar voces personalizadas subiendo audio. El proyecto integra Ope...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

059.4K

De paper a podcast: cómo convertir trabajos académicos en podcasts de conversación entre varias personas

Introducción general Paper to Podcast es una herramienta de código abierto especializada en transformar trabajos de investigación académica en podcasts animados y entretenidos. Utiliza tecnología de inteligencia artificial para convertir un documento en formato PDF en un diálogo entre tres personajes (el anfitrión, el alumno y el experto) para...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

049.7K

MegaTTS3: un modelo ligero para sintetizar el habla china e inglesa

Introducción general MegaTTS3 es una herramienta de síntesis de voz de código abierto desarrollada por ByteDance en colaboración con la Universidad de Zhejiang, centrada en la generación de voz china e inglesa de alta calidad. Su modelo central tiene sólo 0,45 B de parámetros, es ligero y eficiente, admite la generación de habla mixta china e inglesa y la clonación del habla. El proyecto está alojado en ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # Clonación de voz AI

hace 1 año

070.1K

Podcastle: una herramienta de IA para crear rápidamente podcasts de alta calidad

Introducción general Podcastle es una plataforma en línea basada en IA que se especializa en ayudar a los usuarios a crear y editar rápidamente podcasts de alta calidad. Integra funciones de grabación, edición y publicación, y los usuarios pueden hacerlo todo a través de un navegador sin necesidad de equipos especializados ni software complejo. La plataforma utiliza ...

Últimos recursos sobre IA # AI texto a voz # AI editor de audio/vídeo

hace 1 año

055.8K

IndexTTS: Herramienta de conversión de texto a voz con mezcla de chino e inglés

Introducción general IndexTTS es una herramienta de texto a voz (TTS) de código abierto alojada en GitHub y desarrollada por el equipo index-tts. Se basa en la tecnología XTTS y Tortoise , mediante la mejora del diseño del módulo , para proporcionar una eficiente y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

0125.1K

csm-mlx: modelo de generación de voz csm para dispositivos Apple

Introducción completa csm-mlx se basa en el framework MLX desarrollado por Apple, optimizado específicamente para el modelo de diálogo de voz CSM (Conversation Speech Model) de Apple Silicon (Apple Silicon). Este proyecto permite el uso...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

063.2K

Autiobooks: convertir ebooks epub en audiolibros m4b

Introducción general Autiobooks es una herramienta de código abierto diseñada para ayudar a los usuarios a convertir rápidamente libros electrónicos en formato .epub a audiolibros en formato .m4b. Utiliza tecnología de síntesis de voz de alta calidad proporcionada por Kokoro para generar un audio natural y fluido. Esta herramienta fue desarrollada por...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

058.7K

PlayHT: una herramienta de IA para generar habla hiperrealista

Introducción general PlayHT es una eficiente plataforma en línea centrada en la generación de voz AI para ayudar a los usuarios a convertir rápidamente texto en voz natural y realista. Ofrece más de 600 voces de IA compatibles con más de 60 idiomas y diversos acentos para la producción de podcasts, contenido educativo, promoción de marketing...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI

hace 1 año

058.9K

MLX-Audio: herramienta de conversión de texto a voz basada en el framework MLX de Apple.

Introducción general MLX-Audio es una herramienta de código abierto desarrollada sobre la base del marco MLX de Apple, centrada en la funcionalidad de texto a voz (TTS) y de voz a voz (STS). Aprovecha la potencia del silicio de Apple (por ejemplo, los chips de la serie M)...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

0108K

Spark-TTS: una herramienta de conversión de texto en voz para generar habla natural

Introducción general Spark-TTS es una herramienta de conversión de texto a voz (TTS) de código abierto desarrollada por el equipo SparkAudio y alojada en GitHub, diseñada para ayudar a los usuarios a convertir texto en voz natural...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # Clonación de voz AI

hace 1 año

073.8K

Cat & Star: una aplicación para escribir cuentos exclusivos con tu hijo

Introducción general "Cat & Star" (maoyuxing.com) es una plataforma interactiva de creación de cuentos diseñada para niños, que ayuda a padres e hijos a crear juntos cuentos de hadas personalizados a través de aplicaciones móviles. Los usuarios pueden introducir información como el nombre del niño y sus preferencias para generar contenidos de cuentos únicos....

Últimos recursos sobre IA # AI Herramientas educativas # AI texto a voz

hace 1 año

058.4K

Azure TTS Importer: integración de servicios de síntesis de voz en el software de lectura

Introducción general TTS Importer es un proyecto de código abierto diseñado para importar fácilmente los servicios de síntesis de voz Azure TTS (Text-to-Speech) en una variedad de software de lectura. La herramienta es compatible con varios software de lectura populares, incluyendo Read (legado...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

055.6K

NVIDIA PDF to Podcast：设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast: Herramienta de IA para convertir PDF en Podcast mediante la configuración de palabras guía

Introducción general NVIDIA AI Blueprint: PDF to Podcast es un proyecto de código abierto desarrollado por NVIDIA para convertir documentos PDF en atractivos contenidos de audio. El proyecto aprovecha NVIDIA NIM (NVID...

Noticias AI # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

058.3K

Kokoro WebGPU: un servicio de conversión de texto en voz para el funcionamiento sin conexión en navegadores

Introducción general Kokoro WebGPU es una versión WebGPU del modelo de texto a voz (TTS) Kokoro, proporcionado por WebML Community en la plataforma Hugging Face. El proyecto utiliza la tecnología WebGPU para...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

080.5K

Orate: una API unificada para integrar la generación de voz bien conocida, la transcripción de voz y el modelado de voz

Introducción general Orate es un conjunto de herramientas de IA centrado en la generación y transcripción de voz. Proporciona una API unificada que se integra a la perfección con los principales proveedores de IA, como OpenAI, ElevenLabs y AssemblyAI, para ayudar a...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # AI Voz a texto

hace 1 año

065K

Pesos: una canción de imitación de voz y una plataforma de creación de texto a voz

Introducción general Weights es una plataforma social de creatividad que utiliza IA y que permite a los usuarios crear carátulas de voz, texto a voz, imágenes, música y vídeos con acciones sencillas. La plataforma proporciona una gran cantidad de herramientas y plantillas para ayudar a los usuarios a empezar a crear rápidamente y compartir con la comunidad desde...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI

hace 1 año

0130.1K

AnyVoice: ¡clonación de voz en línea gratuita en tan sólo 3 segundos!

Introducción general AnyVoice es una plataforma avanzada de generación de voz por IA que ofrece servicios de clonación de voz y generación de voz ultrarrealistas. La plataforma permite a los usuarios convertir texto en habla natural y elegir entre cientos de voces preestablecidas. Si no encuentra la voz adecuada, sólo tiene que...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI

hace 1 año

084.5K

Open NotebookLM: convierta PDF en podcasts de herramientas de código abierto

Introducción general Open NotebookLM es un proyecto de código abierto diseñado para convertir cualquier documento PDF en un podcast. La herramienta utiliza modelos de código abierto Large Language Model (LLM) y Text-to-Speech (TTS) para procesar contenidos PDF y generar diálogos naturales adecuados para podcasts de audio....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

061.2K

Llasa 1~8B: un modelo de conversión de texto en habla de código abierto para la generación y clonación de habla de alta calidad

Introducción general Llasa-3B es un modelo de conversión de texto a voz (TTS) de código abierto desarrollado por el Laboratorio de Audio de la Universidad de Ciencia y Tecnología de Hong Kong (HKUST Audio). El modelo se basa en la arquitectura Llama 3.2B, que ha sido cuidadosamente ajustada para proporcionar una generación de voz de alta calidad que no sólo soporta múltiples...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # Clonación de voz AI

hace 1 año

076.5K

Kokoro-ONNX: eficaz herramienta de conversión de texto en voz con soporte multilingüe y multivoz

Introducción completa Kokoro-ONNX es una herramienta de texto a voz (TTS) de código abierto basada en el tiempo de ejecución ONNX. Desarrollado por thewh1teagle , el proyecto tiene como objetivo proporcionar soluciones de síntesis de voz eficientes y rápidas.Kokoro-ONNX soporta...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

0107.6K

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

OpenAI Edge TTS: API gratuita de conversión de texto a voz mediante Edge TTS, compatible con los formatos de OpenAI.

Introducción general OpenAI Edge TTS es un proyecto de código abierto que proporciona una API nativa de texto a voz (TTS) compatible con OpenAI. El proyecto utiliza el servicio de texto a voz en línea de Microsoft Edge para...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

085.4K

Jellypod: producción de podcasts multilingües sobre inteligencia artificial, creación, edición y distribución de podcasts sobre inteligencia artificial.

Introducción general Jellypod es un potente estudio de podcasts de AI diseñado para ayudar a los usuarios a crear, editar y publicar fácilmente podcasts de AI de alta calidad. Con Jellypod, los usuarios pueden diseñar anfitriones de podcast personalizados, refinar guiones y publicar podcasts a...

Últimos recursos sobre IA # AI texto a voz

hace 1 año

061.7K

Sherpa-ONNX: reconocimiento y síntesis del habla sin conexión con ONNXRuntime

Introducción general sherpa-onnx es un proyecto de código abierto desarrollado por el equipo Next-gen Kaldi para proporcionar soluciones eficientes de reconocimiento y síntesis de voz offline. Es compatible con múltiples plataformas, incluyendo Android, iOS, Raspber...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # AI Voz a texto

hace 1 año

0288.6K

Audiblez: Generar audiolibros, convertir libros electrónicos en audiolibros con Kokoro

Introducción general Audiblez es un proyecto de código abierto diseñado para convertir libros electrónicos (por ejemplo, en formato .epub) en audiolibros (por ejemplo, en formato .m4b). El proyecto utiliza la tecnología de síntesis de voz de alta calidad de Kokoro para soportar múltiples idiomas y múltiples voces. Los usuarios pueden...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

062.8K

Acoust: plataformas de servicios en línea de generación de voz con inteligencia artificial y texto a voz (TTS)

Introducción general Acoust es una plataforma de servicios de generación de voz y texto a voz (TTS) de IA en línea que utiliza la última tecnología de IA para generar voz realista. La plataforma también proporciona potentes herramientas de edición de vídeo que permiten a los usuarios completar la producción de vídeo sin...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto

hace 1 año

054.7K

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

Kokoro TTS API: Dockerised FastAPI wrapper for fast text-to-speech (modelo Kokoro-82M)

Introducción general Kokoro-FastAPI es una envoltura FastAPI basada en Docker diseñada para proporcionar soporte para el modelo de texto a voz Kokoro-82M. El proyecto es compatible con la aceleración de la GPU NVIDIA y proporciona procesamiento de colas y empalme automático....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

0129.8K

Kokoro: modelos eficientes de síntesis del habla para generar un habla natural y fluida

Introducción general Kokoro 82M es un eficiente modelo de síntesis del habla proporcionado por Hugging Face, diseñado para generar habla de alta calidad con menos parámetros y datos. El modelo tiene 82 millones de parámetros y está licenciado bajo Apache 2.0....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

071.9K

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Introducción general ebook2audiobook es una potente herramienta de conversión de ebooks a audiolibros de código abierto. Es capaz de convertir eBooks en múltiples formatos en audiolibros con marcadores de capítulos completos y metadatos. La herramienta utiliza Calibre para la conversión de formatos de e...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

089.5K

Edge TTS Worker：使用Cloudflare部署微软语音合成API，兼容OpenAI 格式并封装Web界面

Edge TTS Worker: Implementación de las API de síntesis de voz de Microsoft mediante Cloudflare, formato compatible con OpenAI e interfaz web empaquetada

Introducción general Edge TTS Worker (que depende de edge-tts) es un servicio proxy desplegado en Cloudflare Worker que encapsula el servicio Microsoft Edge TTS en un formato compatible con OpenAI ...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

0122.6K

ViiTor AI: Servicio de clonación de voz y síntesis de traducción multilingüe de audio y vídeo

Introducción completa ViiTor AI es una potente plataforma de inteligencia artificial centrada en ofrecer servicios de traducción de vídeo de alta calidad, clonación de voz, vídeos de avatares generados por IA y síntesis de voz. La plataforma es compatible con varios idiomas y tiene como objetivo ayudar a los usuarios a lograr fácilmente la creación de contenidos multilingües.ViiTo...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI # AI editor de audio/vídeo

hace 1 año

083.5K

Wondercraft: herramienta de conversión de texto a audio centrada en la locución de anuncios, audiolibros multijugador y podcasts.

Introducción general Wondercraft es una revolucionaria plataforma de creación de audio y vídeo basada en IA que ofrece a los creadores de contenidos una solución integral para la producción de audio y vídeo. Utilizando tecnología avanzada de IA, la plataforma es capaz de convertir contenido de texto en habla natural y fluida, soportando más de 20 idiomas....

Últimos recursos sobre IA # AI texto a voz

hace 1 año

052.2K

Podcast de NotebookLM: genere un podcast personalizado multilingüe con IA a partir de cualquier documento (de pago)

Descripción general NotebookLM Podcast es una plataforma innovadora que utiliza tecnología de inteligencia artificial para transformar cualquier contenido textual en podcasts de audio dinámicos y atractivos. Tanto si eres estudiante, educador, creador de contenidos o un profesional ocupado, NotebookLM...

Últimos recursos sobre IA # AI texto a voz

hace 1 año

049.9K

AivisSpeech: software de síntesis de voz en japonés emocionalmente rico

Introducción general AivisSpeech es un software de síntesis de voz japonés basado en la interfaz de usuario del editor VOICEVOX. Integra el motor AivisSpeech para generar fácilmente el habla rica emocionalmente.AivisSpeech soporta...

Últimos recursos sobre IA # AI texto a voz

hace 1 año

083.3K

PlayAI: servicios de síntesis de voz y diálogo fluidos y emocionales (en inglés)

Introducción general PlayAI es una plataforma de IA centrada en la generación y clonación del habla. Ofrece una amplia gama de modelos de voz capaces de generar diálogos fluidos y emotivos. Los usuarios pueden utilizar la plataforma para crear agentes de voz personalizados que mejoren la experiencia interactiva.La tecnología de PlayAI aplica...

Últimos recursos sobre IA # AI texto a voz

hace 1 año

064.4K

GizAI：全能AI助手，集成主流生成式AI工具，让每个人免费使用商业化AI工具

GizAI: asistente de inteligencia artificial todo en uno que integra las principales herramientas de inteligencia artificial generativa y pone a disposición de todos las herramientas comerciales de inteligencia artificial.

Introducción general GizAI es una plataforma integral con capacidades integradas de generación de IA, toma de notas y almacenamiento en la nube. Los usuarios pueden generar imágenes, vídeos, audios, textos, personajes, historias y juegos con GizAI, y pueden tomar notas colaborativas y almacenamiento en la nube en la plataforma.GizAI proporciona multi...

Últimos recursos sobre IA # AI generación de imágenes en línea # AI texto a voz Plataforma de diálogo multimodelo integrada # AI

hace 1 año

090.8K

OuteTTS: modelo experimental de conversión de texto en voz, TTS implementado mediante un enfoque de modelado lingüístico puro.

Introducción general OuteTTS es un modelo experimental de conversión de texto en habla (TTS) que utiliza un enfoque de modelado lingüístico puro para generar habla de alta calidad. A diferencia de los sistemas TTS tradicionales, OuteTTS no requiere adaptadores externos ni arquitecturas complejas. El modelo se basa en la arquitectura LLaMa...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

078.3K

PodLM: genere podcasts de audio multilingües de diálogos, páginas web o textos largos (de pago)

Introducción general PodLM es una plataforma de generación de podcast de IA de última generación diseñada para ayudar a los usuarios a convertir rápidamente texto, documentos o contenido de URL en audio de podcast de alta calidad. Al aprovechar la tecnología de IA de vanguardia, PodLM es capaz de generar automáticamente guiones de podcast estructurados y atractivos y...

Últimos recursos sobre IA # AI texto a voz

hace 1 año

050.4K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

SoniTranslate: Solución de código abierto para el doblaje de traducción de vídeo, doblaje múltiple, ajuste de velocidad e imitación del sonido original.

Descripción general SoniTranslate es una herramienta de doblaje multilingüe de vídeo potente y fácil de usar, diseñada para ofrecer una solución de traducción de vídeo y audio sincronizado. Utiliza tecnologías avanzadas de reconocimiento de voz y traducción automática para traducir contenidos de vídeo a varios idiomas y mantener el audio sincronizado. La ...

Últimos recursos sobre IA # AI texto a voz # AI Traducción # AI Voz a texto

hace 1 año

0139.7K

Teaser Dubbing: herramienta de doblaje inteligente centrada en la narración y creación de vídeos cortos

Introducción completa Tease Dubbing es un popular software de doblaje AI con más de 5 millones de usuarios. El software utiliza tecnología avanzada de doblaje inteligente AI para proporcionar efectos de doblaje profesionales y realistas, que es adecuado para vídeos cortos, producción de anuncios, educación y formación y otros escenarios. Teaser Dubbing se compromete a proporcionar a los usuarios...

Últimos recursos sobre IA # AI texto a voz # AI editor de audio/vídeo

hace 1 año

067.3K

YouTube Dubbing：实时将YouTube视频翻译为不同语言并同步配音

Doblaje de YouTube: traduzca vídeos de YouTube a diferentes idiomas y sincronice el doblaje en tiempo real

Introducción general El doblaje de YouTube es una plataforma de doblaje inteligente diseñada para ofrecer servicios de doblaje multilingüe a creadores y espectadores de vídeos. A través de la tecnología de IA, la plataforma es capaz de traducir y generar automáticamente doblajes de vídeos de YouTube, soportando múltiples idiomas y estilos de voz. Los usuarios sólo tienen que instalar...

Últimos recursos sobre IA # AI texto a voz

hace 1 año

067.3K

Podcastfy：多源内容转多语言音频对话工具，NotebookLM 播客功能的开源替代方案

Podcastfy: Herramienta de conversión de contenidos de múltiples fuentes a audio multilingüe, una alternativa de código abierto a las funciones de podcasting de NotebookLM.

Introducción general Podcastfy es un paquete Python de código abierto que utiliza la tecnología de Inteligencia Artificial Generativa (GenAI) para convertir contenidos web, archivos PDF, texto, imágenes, vídeos de youtube y muchas otras fuentes en...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

058.3K

QuickPiperAudiobook：一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: una clave para generar audiolibros con calidad de sonido natural, compatible con PDF, epub, docx y otros formatos.

Introducción completa QuickPiperAudiobook es un proyecto de código abierto diseñado para convertir una variedad de formatos de texto (por ejemplo, epub, mobi, txt, PDF, HTML, etc) en audiolibros de sonido natural a través de un simple comando. La herramienta utiliza Pi...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 2 años

053.6K

PDF2Audio: herramienta de conversión de PDF a audio, PDF a podcasts

Introducción general PDF2Audio es un proyecto de código abierto diseñado para convertir archivos PDF en contenidos de audio como podcasts, conferencias y resúmenes. La herramienta aprovecha el modelo GPT de OpenAI para la generación de texto y la conversión de texto a voz, y permite a los usuarios cargar varios PDF ...

Últimos recursos sobre IA # AI texto a voz

hace 2 años

063.4K

Seaweed AI: plataforma inteligente de síntesis y clonación de voz

Introducción completa Seaweed AI es un producto de doblaje inteligente que puede convertir texto en voz en línea, impulsado por la plataforma abierta Yun Zhisheng AI. Los usuarios pueden ayudarse a sí mismos para lograr la clonación de voz, y proporcionar AI pronunciadores de diferentes géneros, acentos e idiomas, y directamente doblar la voz después de introducir el texto. Puede doblar rápidamente...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI

hace 2 años

051.3K

edge-tts: módulo Python de conversión de texto a voz | Servicio gratuito de conversión de texto a voz

Descripción general edge-tts es un módulo Python de código abierto que permite a los usuarios utilizar el servicio de texto a voz en línea de Microsoft Edge en código Python sin necesidad del navegador Microsoft Edge, el sistema operativo Windows o la API secreta....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 2 años

0109.1K

Descript: Edición integral de vídeo y podcast, tan sencilla como editar un documento

Descript Descripción general Descript es una herramienta de edición de vídeo y podcasts potente pero fácil de usar. Tiene una precisión y velocidad de transcripción líderes en el sector y potentes herramientas de corrección, así como la capacidad de transcribir vídeo a texto con tecnología de IA y editar vídeo editando el texto. Además de...

Últimos recursos sobre IA # AI texto a voz # AI editor de audio/vídeo

hace 2 años

065.2K

Murf AI: Cambiador de voz|Conversor de voz a texto|Texto a voz|Editor de audio

Introducción general Murf AI es una potente herramienta de generación de voz de inteligencia artificial en línea que convierte texto en voz humana casi real. Ofrece hasta 120 + opciones de voz AI, soporta 20 + idiomas, y es adecuado para una variedad de situaciones tales como podcasts, videos, presentaciones profesionales, etc.Mu...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto

hace 2 años

057.3K

Resemble AI: Plataforma de síntesis de voz de inteligencia artificial | Clonación de voz | Detección profunda de audio falso

Introducción general Resemble AI es una plataforma de síntesis de voz de inteligencia artificial diseñada para la empresa. La plataforma proporciona tecnología puntera de generación de voz mediante IA y detección profunda de audio falso para la futura seguridad de la información. Entre sus funciones se incluyen la clonación de voz, la detección profunda de audio falsificado en tiempo real, la tecnología de marca de agua de IA...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI

hace 2 años

059K

Ondoku: Lector de texto en línea|Lector de texto a voz|Lector de imagen a voz

Ondoku Introducción general Ondoku es un software de conversión de texto a voz en línea que permite a los usuarios introducir contenido de texto en el cuadro de texto proporcionado por el sitio web, y el software es capaz de convertir el artículo en una lectura de voz de acuerdo con las necesidades del usuario, y admite guardar la voz como un archivo de formato MP3. Este servicio es adecuado tanto para la escucha instantánea...

Últimos recursos sobre IA # AI texto a voz

hace 2 años

0100.6K

XAudioPro: herramienta profesional de edición de audio en línea|producción de audiolibros|de texto a voz|separación de acompañamientos

Introducción general XAudioPro es una herramienta avanzada de edición y transcodificación de audio en tiempo real en línea que es a la vez profesional y portátil. Soporta funciones profesionales de edición de audio como cortar, recortar, copiar, borrar, restaurar y controlar la ganancia de amplitud. También ofrece servicios de eliminación de ruido, como reducción de ruido por sustracción espectral,...

Últimos recursos sobre IA # AI texto a voz # AI editor de audio/vídeo

hace 2 años

064.7K

Hume AI：赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: Potenciación de la IA mediante el reconocimiento de emociones | Reconocimiento de estados emocionales a partir de sonidos y expresiones | Generación de discurso con estados emocionales

Introducción general Hume AI es una empresa de IA centrada en la inteligencia emocional, que desarrolla tecnologías de IA multimodal que comprenden las emociones humanas y responden a ellas. Su producto estrella, Empathic Voice Interface (EVI), es capaz de reconocer y responder a las...

Últimos recursos sobre IA # AI Servicios abiertos # AI texto a voz

hace 2 años

073.8K

Magic Voice Workshop: plataforma de creación de locuciones profesionales y narraciones de vídeos cortos | locución de persona real | clonar la voz | con un clic en una película

Introducción completa Magic Voice Workshop es una plataforma integral de doblaje de vídeos cortos y de IA con información sobre doblaje por software, doblaje real, bibliotecas de sonido, servicios de clonación y mucho más. La plataforma integra edición de audio, generación de copias de IA, edición de vídeo y herramientas de colaboración para servicios relacionados con el audio y la creación de contenidos. Los usuarios experimentan el editor de audio...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI # AI editor de audio/vídeo

hace 2 años

067.6K

EmotiVoice: motor de conversión de texto a voz con controles multivoz y emocionales.

Introducción EmotiVoice es un motor de texto a voz (TTS) con múltiples voces y control de señales emocionales desarrollado por NetEaseYoudao. Este motor TTS de código abierto soporta inglés y chino, tiene más de 2000 voces diferentes, y tiene capacidad de síntesis de emoción para crear voz con...

Últimos recursos sobre IA # AI texto a voz

hace 1 año

087.8K

Listnr: generador de voz multilingüe con inteligencia artificial, tecnología de síntesis de voz humana transformadora

Introducción general Listnr es un software de texto a voz con un motor de IA generativa que crea síntesis de voz en más de 1.000 voces diferentes en más de 142 idiomas, incluyendo la clonación de su propia voz. La plataforma da servicio a más de 1 millón de usuarios en vídeos cortos, YouTub...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI

hace 2 años

063.1K

Uberduck: música rap generada por inteligencia artificial y plataforma de clonación de voz | Text to Speech

Introducción general Uberduck AI es una plataforma innovadora que ofrece síntesis de IA de voces cantadas y habladas para agencias creativas, productores musicales y programadores. Los usuarios pueden elegir diferentes ritmos musicales, generar letras mediante IA o escribir las suyas propias, seleccionar sonidos específicos y, en definitiva, crear canciones de rap....

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI # AI Música

hace 2 años

059.4K

NotebookLM: Lectura de recuperación de notas de conocimiento, generación de documentos multiclase Podcasts de diálogo de voz

Introducción general NotebookLM es una herramienta de colaboración personalizada con IA de Google diseñada para ayudar a los usuarios a utilizar su mente al máximo. Los usuarios pueden cargar documentos y NotebookLM domina al instante el contenido de estas fuentes, facilitando la lectura...

Últimos recursos sobre IA # AI Herramientas educativas # AI texto a voz # AI Notas

hace 10 meses

061K

Record Cafe: Plataforma integral de procesamiento de audio/vídeo|Generación de vídeo|Subtítulos AI|Extracción de audio|Conversión de voz en texto

Introducción completa Record Cafe es una plataforma integral de procesamiento de audio/vídeo que proporciona servicios de diálogo de vídeo AI, subtítulos AI y conversión de voz a texto AI. Las funciones incluyen grabación de pantalla, edición de vídeo, conversión de GIF/audio, etc., y admite almacenamiento y uso compartido en la nube. La interfaz es intuitiva y fácil de usar, y también es compatible con la grabación multi-pantalla y multi-lenguaje inteligente ...

Últimos recursos sobre IA # AI de texto a vídeo # AI texto a voz # AI Voz a texto

hace 1 año

067K

IMS Toucan: herramienta de conversión de texto a voz multilingüe (compatible con más de 7000 idiomas), rápida y controlable.

Introducción general IMS Toucan es un avanzado kit de herramientas de conversión de texto a voz (TTS) desarrollado por el Instituto de Procesamiento del Lenguaje Natural (IMS) de la Universidad de Stuttgart (Alemania). El kit de herramientas es compatible con más de 7000 idiomas y es rápido, controlable y requiere pocos recursos informáticos.IMS...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

058.4K

ChatTTS: un modelo de generación de voz que imita la voz de una persona real hablando (paquete de aceleración ChatTTS one-click)

Introducción general ChatTTS es un modelo generativo del habla diseñado para escenarios de diálogo. Genera un habla natural y expresiva, admite varios idiomas y varios hablantes, y es adecuado para diálogos interactivos. Para ello, el modelo predice y controla con precisión características rítmicas como la risa, las pausas y las interjecciones,...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

071.1K

FreeTTS: Herramienta gratuita de conversión de texto a voz en línea|Mejora de audio|Clips de audio

FreeTTS Descripción general FreeTTS es una herramienta gratuita de conversión de texto a voz en línea que permite a los usuarios convertir texto en archivos de voz con sonido natural. Con soporte para múltiples idiomas y opciones de sonido, los usuarios pueden convertir texto a formatos MP3, WAV, OGG y ACC...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto # AI editor de audio/vídeo

hace 2 años

068.9K

ElevenLabs: plataforma de generación de voz de IA de alta calidad, herramienta de doblaje de texto y clonación de voz

Introducción general ElevenLabs es una startup con sede en Nueva York, EE.UU., especializada en el campo de la IA generativa del habla. La empresa ofrece una gama de potentes servicios para el habla generada por texto, el habla generada por voz, la clonación del habla y el reconocimiento del habla.ElevenLabs destaca en...

Últimos recursos sobre IA # AI texto a voz # Clonación de voz AI

hace 2 años

058.4K

Easy Voice Toolkit: kit de herramientas de voz AI para implantación local

Introducción exhaustiva Easy-Voice-Toolkit es un conjunto de herramientas multifuncionales basado en el Open Source Speech Project, que proporciona una amplia gama de herramientas de audio automatizadas para el reconocimiento del habla, la transcripción del habla, la conversión del habla, la creación de conjuntos de datos y el entrenamiento de modelos. Los usuarios pueden utilizar estas herramientas de forma selectiva según sus necesidades...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # Clonación de voz AI

hace 2 años

063.9K

DupDub: editor de vídeo con inteligencia artificial | doblaje | traducción de vídeo | digitalizador de fotos

Descripción general Dupdub es una plataforma de creación de podcasts y presentaciones de vídeo que ofrece una serie de herramientas de IA para apoyar la creatividad de los usuarios. Sus funciones abarcan la creación de texto a vídeo, ofreciendo servicios de doblaje de voz y vídeo con IA, así como edición de vídeo, transcripción y subtitulación. Dupdub es también ...

Últimos recursos sobre IA # AI Digital Man # AI texto a voz # AI Voz a texto

hace 2 años

055.2K

TTSMaker: herramienta gratuita de conversión de texto a voz en línea

Introducción general TTSMaker es una herramienta gratuita de conversión de texto a voz en línea que admite más de 100 idiomas y 300 estilos de voz. Los usuarios pueden convertir texto en habla natural y fluida y descargar archivos de audio para uso comercial. La herramienta es adecuada para doblaje de vídeo, audiolibros, educación y formación...

Últimos recursos sobre IA # AI texto a voz

hace 2 años

068.7K

Vidnoz AI: Genera Videos Digitales de Habla Humana con Sólo una Foto, Múltiples Herramientas Gratuitas de Generación de Video

Descripción General Vidnoz es una plataforma gratuita de generación de vídeos AI para crear rápidamente vídeos AI en menos de 1 minuto. No requiere coste, descarga ni experiencia. La plataforma ofrece más de 500 avatares AI, más de 470 locuciones AI realistas y más de 500 plantillas. Con Vidnoz AI video...

Últimos recursos sobre IA # AI Imagen a Vídeo # AI Digital Man # AI de texto a vídeo

hace 2 años

084K

Memo AI: Cliente nativo de vídeo a subtítulos, conversión de subtítulos multilingües

Descripción general MemoAI es una potente herramienta de traducción de vídeo diseñada para convertir archivos de vídeo y audio en texto, subtítulos y notas. Ya sea un vídeo de YouTube, un podcast o un archivo local, MemoAI puede manejarlo con facilidad. Es compatible con más de 90 idiomas como chino, inglés, japonés...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto # AI editor de audio/vídeo

hace 1 año

066.1K

Tencent Smart Shadow: herramienta inteligente de creación de vídeo | AI Digital Man, kit de generación de anime

Introducción Tencent Smart Shadow es una plataforma de creación de vídeo inteligente en línea lanzada por Tencent, que puede soportar el doblaje de texto, la transmisión humana digital, el reconocimiento automático de subtítulos y otras funciones a través de potentes herramientas de IA proporcionadas por servicios en la nube.

Últimos recursos sobre IA # AI Escritura # AI Digital Man # AI de texto a vídeo

hace 2 años

082.5K

pyvideotrans: Herramienta de doblaje para la traducción de vídeos

pyVideoTrans Introducción general pyvideotrans es una herramienta de traducción y doblaje de vídeo. Los usuarios pueden traducir contenidos de vídeo de un idioma a otro, y añadir el doblaje y los subtítulos adecuados al vídeo. Se basa en openai-whisper offline...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto # AI editor de audio/vídeo

hace 2 años

083.3K

Recorte de sonido: voz humana natural de Himalaya, plataforma de creación de audio con varios narradores

Introducción completa Himalaya Audio Editor es una plataforma completa de creación de audio AI. Ofrece potentes funciones que ayudan a los usuarios con la producción de podcast de nivel profesional, grabación multipista, edición de audio, y la capacidad de convertir texto a voz. La plataforma también contiene múltiples opciones para voz profesional, ayudando a los usuarios...

Últimos recursos sobre IA # AI texto a voz # AI editor de audio/vídeo

hace 2 años

063.3K

Parler-TTS: generación de modelos de conversión de texto en voz específicos para cada hablante a partir de un texto de entrada

Introducción general Parler-TTS es una biblioteca de modelos de texto a voz (TTS) de código abierto desarrollada por Hugging Face, diseñada para generar habla de alta calidad y sonido natural. El modelo es capaz de generar habla a partir de un texto de entrada con un estilo de locutor específico (por ejemplo, género, tono, estilo de habla...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

068.3K

No es eso.