AI de voz a texto

Total 56 artículos

ordenar

Abogen: una herramienta para convertir múltiples formatos de texto en audiolibros

Introducción general Abogen es una herramienta de código abierto diseñada para convertir rápidamente archivos ePub, PDF o de texto plano en audio de alta calidad. Utiliza el modelo Kokoro-82M para generar un habla natural y fluida, y admite la generación simultánea de subtítulos, lo que resulta idóneo para producir audiolibros....

hace 11 meses

078.5K

Kimi-Audio: modelo base de procesamiento de audio y diálogo de código abierto

Introducción general Kimi-Audio es un modelo de base de audio de código abierto desarrollado por Moonshot AI, centrado en la comprensión, generación y diálogo de audio. Es compatible con una amplia gama de tareas de procesamiento de audio, como el reconocimiento del habla, el Q&A de audio y el reconocimiento de las emociones del habla. El modelo se ha probado en más de 130...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # AI Voz a texto

hace 11 meses

0126K

On Device AI: Herramienta de transcripción de voz y chat para iPhone Native Running

Introducción general On-Device AI es una aplicación de IA que se ejecuta completamente sin conexión, diseñada para dispositivos Apple, compatible con iOS, macOS y visionOS.Proporciona ejecución local de modelos lingüísticos a gran escala (LLM), transcripción de voz en tiempo real, análisis de documentos, etc., sin necesidad de...

Últimos recursos sobre IA # AI Aplicación de chat localizada # AI Voz a texto

hace 11 meses

076.2K

Vexa: una herramienta inteligente de transcripción de reuniones y extracción de conocimientos en tiempo real

Introducción completa Vexa es una plataforma de código abierto para la transcripción de reuniones en tiempo real y la gestión del conocimiento diseñada para proporcionar servicios eficientes de grabación de reuniones y extracción inteligente del conocimiento para empresas y particulares. Se une automáticamente a plataformas como Google Meet, Zoom, etc. mediante robots de reuniones basados en API....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta AI de resumen de texto y audio/vídeo # AI Voz a texto

hace 12 meses

0105.1K

Herramienta de código abierto para la conversión de voz a texto en tiempo real

Introducción general realtime-transcription-fastrtc es un proyecto de código abierto centrado en la conversión de voz a texto en tiempo real. Utiliza la tecnología FastRTC para procesar flujos de audio de baja latencia , combinada con un modelo Whisper local para lograr una eficiente...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

068.1K

Transkriptor: la herramienta de transcripción inteligente que convierte audio y vídeo en texto

Introducción general Transkriptor es una herramienta de transcripción basada en IA que se centra en convertir audio y vídeo en texto rápidamente. Es compatible con más de 100 idiomas con una tasa de precisión de hasta 99% y es adecuado para una amplia gama de escenarios, tales como reuniones, entrevistas, notas de clase y más. Los usuarios pueden cargar archivos,...

Últimos recursos sobre IA # Herramienta AI de resumen de texto y audio/vídeo # AI Traducción # AI Voz a texto

hace 1 año

079.1K

Otter.ai: asistente inteligente para reuniones con herramienta de transcripción de voz en tiempo real

Descripción general Otter.ai es una herramienta de gestión de reuniones y transcripción de voz impulsada por IA con funciones básicas para convertir la voz en texto en tiempo real y generar automáticamente notas de reuniones, resúmenes y elementos de acción. Cuenta con el apoyo inteligente de un agente de reuniones...

Últimos recursos sobre IA # Herramienta AI de resumen de texto y audio/vídeo # AI Voz a texto

hace 1 año

068.8K

TurboScribe: la herramienta en línea para convertir rápidamente audio y vídeo en texto

Descripción general TurboScribe es una herramienta de transcripción basada en IA que se centra en convertir audio y vídeo a texto rápidamente. Es compatible con más de 98 idiomas con una tasa de precisión de 99,8% para los usuarios que necesitan procesar contenido de voz de manera eficiente. Los usuarios pueden cargar archivos, generar notas de texto...

Últimos recursos sobre IA # AI Voz a texto

hace 1 año

088K

Aqua Voice: generación de texto preciso con entrada de voz multiaplicación

Introducción general Aqua Voice es una herramienta inteligente de generación de texto basada en la voz y centrada en convertir rápidamente la voz del usuario en texto formateado. Fue creada en 2023 por Finnian Brown y Jack McIntire y tiene su sede en Estados Unidos....

Últimos recursos sobre IA # AI Voz a texto

hace 1 año

0181.3K

Dolphin: reconocimiento de lenguas asiáticas y modelización de voz a texto para lenguas asiáticas

Introducción general Dolphin es un modelo de código abierto desarrollado por DataoceanAI y la Universidad de Tsinghua, centrado en el reconocimiento del habla y del lenguaje para las lenguas asiáticas. Es compatible con 40 lenguas de Asia Oriental, Asia Meridional, Asia Sudoriental y Oriente Medio, así como con 22 dialectos chinos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

062.5K

TwinMind: aplicación gratuita de transcripción de voz a texto sin conexión

TwinMind es una herramienta inteligente desarrollada por ThirdEar AI, Inc. que "te ayuda a recordarlo todo". Puede grabar y convertir conversaciones, reuniones o conferencias en texto en tiempo real, en más de 100 idiomas, incluso con el teléfono en el bolsillo, y...

Últimos recursos sobre IA # Herramienta AI de resumen de texto y audio/vídeo # AI Voz a texto

hace 1 año

060.3K

Wispr Flow: utiliza tu voz para introducir texto rápidamente en cualquier aplicación

Descripción general Wispr Flow es una herramienta para introducir texto por voz, que ayuda a los usuarios a escribir rápidamente en sus ordenadores. Es una experiencia "3 veces más rápida que teclear" que permite a los usuarios introducir texto en cualquier aplicación como Word, Slack o G...

Últimos recursos sobre IA # AI Voz a texto

hace 10 meses

0127.6K

Reunión: transcripción local en tiempo real y generación de actas de reunión del cliente de código abierto

Introducción general Meeting Minutes (también conocido como Meetily) es un asistente de reuniones gratuito y de código abierto desarrollado por Zackriya Solutions, centrado en capturar el audio de las reuniones en tiempo real, generar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta AI de resumen de texto y audio/vídeo # AI Voz a texto

hace 1 año

0107.5K

Local-NotebookLM: PDF local para generar podcasts de voz de herramientas de código abierto

Introducción completa Local-NotebookLM es un proyecto de código abierto que tiene como objetivo proporcionar localmente ejecutar herramientas inteligentes de procesamiento de documentos y generación de contenidos. Está inspirado en Google NotebookLM , centrándose en ayudar a los usuarios a PDF y otros documentos en una variedad de ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

088.7K

AssemblyAI: plataforma de análisis de voz a texto y audio inteligente de alta precisión

Introducción general AssemblyAI es una plataforma centrada en la tecnología de IA del habla, que proporciona a desarrolladores y empresas herramientas eficaces de análisis de voz a texto y audio. Su producto estrella es la familia de modelos Universal, especialmente el recién lanzado Universal-2...

Últimos recursos sobre IA # AI Servicios abiertos # AI Voz a texto

hace 1 año

070.9K

FireRedASR: un modelo de código abierto para el reconocimiento multilingüe de voz de alta precisión

Introducción general FireRedASR es un modelo de reconocimiento del habla desarrollado y de código abierto por el equipo de Little Red Book FireRed, centrado en proporcionar soluciones de reconocimiento automático del habla (ASR) de alta precisión y compatibles con varios idiomas. El proyecto está alojado en GitHub para desarrolladores e investigadores, y ofrece...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

0101.4K

WhisperChain: conversión de voz a texto en tiempo real y optimización de las palabras habladas

Introducción general WhisperChain es un proyecto de código abierto basado en IA alojado en GitHub y dirigido por el desarrollador Chris Choy. Se utiliza principalmente para convertir voz en texto y optimizar automáticamente la expresión mediante tecnología de IA, eliminando redundancias....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

057.7K

LLPlayer: un reproductor de vídeo que genera subtítulos en tiempo real con traducción bilingüe

Introducción general LLPlayer es un reproductor multimedia de código abierto para estudiantes de idiomas, alojado en GitHub y creado por el desarrollador umlx5h. Integra una variedad de características útiles como la visualización de subtítulos bilingües, subtítulos autogenerados por IA, traducción en tiempo real y búsqueda de palabras....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Traducción # AI Voz a texto

hace 10 meses

0216.1K

CapsWriter-Offline: Herramienta de entrada de voz y transcripción de subtítulos para PC

Introducción general CapsWriter-Offline es una herramienta de entrada de voz y transcripción de subtítulos para PC, alojada en GitHub y creada por el desarrollador HaujetZhao. Se ejecuta completamente fuera de línea y no requiere una conexión a Internet para...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

067.8K

Whisper Input: un servicio gratuito y rápido de transcripción de voz a texto mediante Groq

Descripción general Whisper Input es una herramienta de transcripción de voz de código abierto que permite a los usuarios iniciar la grabación de voz pulsando el botón Opción y finalizar la grabación levantando el botón. La herramienta llama Groq Whisper Large V3 Turbo ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

074.5K

LiberSonora: Extracción de subtítulos de audiolibros y traducción multilingüe, transcripción de audiolibros a varios idiomas

Introducción LiberSonora, que significa "sonido libre", es un potente conjunto de herramientas de código abierto para audiolibros. Es compatible con la extracción inteligente de subtítulos, la generación de títulos AI, traducción multi-idioma, etc., y es capaz de procesamiento por lotes fuera de línea bajo GPU acceleration.LiberSo...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Traducción # AI Voz a texto

hace 1 año

055K

AudioNotes: Extraiga rápidamente contenidos de audio y vídeo y genere notas estructuradas

Introducción completa AudioNotes es un sistema de audio / vídeo a notas estructuradas construido sobre FunASR y Qwen2. Se puede extraer rápidamente el contenido de audio / vídeo y llamar al modelo grande para generar un estructurado notas Markdown, que es conveniente para...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

058K

Orate: una API unificada para integrar la generación de voz bien conocida, la transcripción de voz y el modelado de voz

Introducción general Orate es un conjunto de herramientas de IA centrado en la generación y transcripción de voz. Proporciona una API unificada que se integra a la perfección con los principales proveedores de IA, como OpenAI, ElevenLabs y AssemblyAI, para ayudar a...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # AI Voz a texto

hace 1 año

065K

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: herramienta multilingüe de conversión de voz a texto más pequeña y rápida que Whisper-Large v3

Introducción completa PengChengStarling (PengCheng Labs) es una herramienta multilingüe de reconocimiento automático del habla (ASR) capaz de convertir el habla en distintos idiomas en el texto correspondiente. Este conjunto de herramientas se ha desarrollado a partir del proyecto icefall y proporciona un proceso completo de reconocimiento del habla...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

061.4K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT: herramienta de conversión de voz a texto en tiempo real para el reconocimiento del habla en streaming de baja latencia basada en Whisper.

Introducción general RealtimeSTT es una eficaz biblioteca de conversión de voz a texto en tiempo real de baja latencia con detección avanzada de la actividad del habla y activación de la palabra de despertador. Ha sido desarrollada por Kolja Beigel para dar soporte a aplicaciones que requieren una conversión de voz a texto...

Noticias AI # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

090.4K

Sherpa-ONNX: reconocimiento y síntesis del habla sin conexión con ONNXRuntime

Introducción general sherpa-onnx es un proyecto de código abierto desarrollado por el equipo Next-gen Kaldi para proporcionar soluciones eficientes de reconocimiento y síntesis de voz offline. Es compatible con múltiples plataformas, incluyendo Android, iOS, Raspber...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # AI Voz a texto

hace 1 año

0288.6K

Acoust: plataformas de servicios en línea de generación de voz con inteligencia artificial y texto a voz (TTS)

Introducción general Acoust es una plataforma de servicios de generación de voz y texto a voz (TTS) de IA en línea que utiliza la última tecnología de IA para generar voz realista. La plataforma también proporciona potentes herramientas de edición de vídeo que permiten a los usuarios completar la producción de vídeo sin...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto

hace 1 año

054.8K

Notta: herramienta de transcripción de audio y grabación de reuniones para transcribir automáticamente reuniones, entrevistas o grabaciones.

Descripción general Notta es una potente herramienta de transcripción de audio y grabación de reuniones diseñada para ayudar a los usuarios a convertir automáticamente reuniones, entrevistas o grabaciones en texto con capacidad de búsqueda. Con Notta, los usuarios pueden transcribir, editar, resumir y colaborar fácilmente para aumentar la productividad.Notta admite...

Últimos recursos sobre IA # Herramienta AI de resumen de texto y audio/vídeo # AI Voz a texto

hace 1 año

078.9K

AI no jimaku gumi: generación y traducción automática de subtítulos multilingües para vídeos con ayuda de la IA.

Introducción general AI no jimaku gumi (AI no subtitle group) es una potente herramienta de procesamiento de subtítulos de vídeo de línea de comandos centrada en permitir funciones automatizadas de extracción, transcripción y traducción de subtítulos de vídeo. La herramienta integra tecnologías avanzadas de inteligencia artificial, como...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Traducción # AI Voz a texto

hace 1 año

064.6K

FunClip: edición inteligente de contenidos de vídeo en cortometrajes, extracción/recorte preciso de clips de vídeo de forma sencilla

Introducción FunClip es una herramienta automatizada de edición de vídeo de código abierto desarrollada por TONGYI Speech Lab del Instituto Dharma de Alibaba. La herramienta integra el modelo de reconocimiento de voz industrial Paraformer-Large, que puede identificar con precisión el habla en el vídeo....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto # AI editor de audio/vídeo

hace 1 año

0113.5K

BetterWhisperX: reconocimiento automático de voz independiente del orador que proporciona marcas de tiempo de gran precisión a nivel de palabra.

Introducción general BetterWhisperX es una versión optimizada del proyecto WhisperX centrada en proporcionar servicios de Reconocimiento Automático del Habla (ASR) eficientes y precisos. Como rama mejorada de WhisperX, el proyecto fue desarrollado por Federico ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

077.2K

Freed: asistente de transcripción médica con inteligencia artificial que transcribe con precisión las conversaciones entre médico y paciente y reduce el papeleo de documentación de las visitas.

Descripción general Freed es un asistente de transcripción médica AI diseñado para profesionales de la salud. Ayuda a los médicos y otros profesionales de la salud a registrar automáticamente las visitas de los pacientes, reducir el papeleo y mejorar la eficiencia del trabajo a través de la tecnología avanzada de IA.La transcripción de IA de Freed...

Últimos recursos sobre IA # AI Voz a texto

hace 1 año

058.3K

Voicenotes: notas de voz con inteligencia artificial, grabación y transcripción de voz, gestión inteligente del contenido de las reuniones

Introducción general Voicenotes es una aplicación de notas de voz inteligente diseñada para ayudar a los usuarios a grabar y gestionar fácilmente notas de voz y reuniones. La aplicación permite la transcripción de voz en más de 100 idiomas. Los usuarios simplemente dicen sus pensamientos y Voicenotes los transcribe automáticamente en texto....

Últimos recursos sobre IA # AI Notas # AI Voz a texto

hace 1 año

066.7K

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Voice-Pro: herramienta de traducción de vídeo multifuncional de código abierto, transcripción y traducción de voz a varios idiomas, instalación de Windows con un solo clic.

Introducción general Voice-Pro es una herramienta versátil basada en Gradio WebUI que admite voz a texto, texto a voz, traducción en tiempo real, descarga de vídeos de YouTube y separación de voz humana. Integra Whisper, Faster-Wh...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Traducción # AI Voz a texto

hace 1 año

073K

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换

Zamzar: Herramienta online multifuncional de conversión de formatos de archivo, conversión de vídeo | conversión de audio | conversión de imágenes | conversión de documentos

Introducción general Zamzar es una potente herramienta de conversión de archivos en línea que soporta más de 1200 formatos de archivo. Ya sean documentos, imágenes, vídeos, audios o libros electrónicos, Zamzar puede hacerlo de forma rápida y eficiente. Los usuarios no necesitan descargar ningún software...

Últimos recursos sobre IA # AI Servicios abiertos # AI Voz a texto

hace 1 año

079.8K

AI Hear: software de transcripción y traducción de voz en tiempo real que funciona nativamente sin conexión a Internet

Descripción general Si utilizas un MacBook, prueba AI Hear: puedes grabar audio, convertir voz local en tiempo real a texto y traducir, y eventualmente exportar subtítulos. Puedes utilizarlo como ayuda para escuchar reuniones internacionales y audiolibros en inglés. AI Hear es un software de ejecución local que proporciona...

Últimos recursos sobre IA # AI Traducción # AI Voz a texto

hace 1 año

063.9K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

SoniTranslate: Solución de código abierto para el doblaje de traducción de vídeo, doblaje múltiple, ajuste de velocidad e imitación del sonido original.

Descripción general SoniTranslate es una herramienta de doblaje multilingüe de vídeo potente y fácil de usar, diseñada para ofrecer una solución de traducción de vídeo y audio sincronizado. Utiliza tecnologías avanzadas de reconocimiento de voz y traducción automática para traducir contenidos de vídeo a varios idiomas y mantener el audio sincronizado. La ...

Últimos recursos sobre IA # AI texto a voz # AI Traducción # AI Voz a texto

hace 1 año

0139.7K

FunASR: kit de herramientas de reconocimiento del habla de código abierto, separación de hablantes/reconocimiento del habla en diálogos multipersona

Introducción FunASR es un conjunto de herramientas de reconocimiento del habla de código abierto desarrollado por la Academia Alibaba Dharmo para unir la investigación académica y las aplicaciones industriales. Es compatible con una amplia gama de funciones de reconocimiento del habla, incluido el reconocimiento del habla (ASR), la detección del punto final de la voz (VAD), la recuperación de la puntuación, el modelado del lenguaje, el habla...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 2 años

0159.1K

AsrTools: herramienta de conversión de voz en subtítulos, cliente ligero con interfaces integradas para Cutscene, Racer y Must-Cut.

Introducción completa AsrTools es una herramienta inteligente de voz a texto con interfaces incorporadas de grandes jugadores como Cutscene, QuickScope y MustScope, que soporta procesamiento por lotes multihilo eficiente sin necesidad de GPU o configuraciones tediosas. Se basa en el desarrollo PyQt5, interfaz hermosa y fácil de usar, capaz de salida SRT y TXT palabras de formato ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 2 años

077.8K

Happy Scribe: Plataforma de transcripción de audio y subtitulación de vídeo | Software gratuito de subtitulación de vídeo

Happy Scribe Descripción general Happy Scribe ofrece servicios de transcripción de audio automatizada y manual para convertir audio a texto con gran precisión y compatibilidad con varios idiomas y formatos. Incluye un editor interactivo, herramientas de colaboración, múltiples formatos de exportación, traducción automática...

Últimos recursos sobre IA # AI Voz a texto # AI editor de audio/vídeo

hace 2 años

069.5K

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop

Whisper GPGPU: OpenAI Whisper en Windows|Whisperdesktop

Introducción general Whisper es un proyecto de código abierto de GitHub desarrollado por Const-me que se centra en la inferencia de alto rendimiento del modelo de reconocimiento automático del habla (ASR) Whisper de OpenAI mediante GPGPU. Este proyecto se basa en la licencia MPL-2.0...

Últimos recursos sobre IA # AI Voz a texto

hace 2 años

0106.6K

Buzz: herramienta de traducción de transcripción de audio offline de código abierto | transcripción de voz IOS

Buzz Introducción general Buzz es un proyecto de código abierto creado por chidiwilliams que permite la transcripción y traducción offline de audio en ordenadores personales. El proyecto se basa en la tecnología Whisper de OpenAI, que permite a los usuarios no depender de una conexión a Internet para...

Últimos recursos sobre IA # AI Voz a texto

hace 2 años

0143.8K

Deepgram: API de servicios para soluciones de reconocimiento y síntesis del habla de alta precisión

Descripción general Deepgram es una empresa especializada en tecnologías de reconocimiento de voz y procesamiento del lenguaje natural que ofrece potentes API de conversión de voz a texto y de texto a voz....

Últimos recursos sobre IA # AI Servicios abiertos # AI Voz a texto

hace 1 año

075.7K

Murf AI: Cambiador de voz|Conversor de voz a texto|Texto a voz|Editor de audio

Introducción general Murf AI es una potente herramienta de generación de voz de inteligencia artificial en línea que convierte texto en voz humana casi real. Ofrece hasta 120 + opciones de voz AI, soporta 20 + idiomas, y es adecuado para una variedad de situaciones tales como podcasts, videos, presentaciones profesionales, etc.Mu...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto

hace 2 años

057.3K

VideoLingo：视频转录单词级时间轴字幕，视频字幕翻译和本地化配音开源工具

VideoLingo: herramientas de código abierto para la transcripción de vídeo, la traducción de subtítulos de vídeo y el doblaje localizado.

Descripción general VideoLingo es una herramienta integral de traducción y localización de vídeos diseñada para generar subtítulos de alta calidad propios de Netflix, eliminando la traducción automática sin procesar y los subtítulos multilínea, y añadiendo voces en off de alta calidad para poder compartir conocimientos globales más allá de las barreras lingüísticas. Por...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Traducción # AI Voz a texto

hace 1 año

066K

ALog: aplicación portátil de diario vocal con inteligencia artificial y conversión de voz a texto.

Introducción general ALog es una aplicación de diario de voz basada en IA diseñada para ayudar a los usuarios a registrar su vida diaria por voz. Está desarrollada por duxins y de código abierto en GitHub. Los usuarios pueden grabar entradas de diario a través de la entrada de voz, y la aplicación convertirá automáticamente la voz en texto ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

061.2K

Record Cafe: Plataforma integral de procesamiento de audio/vídeo|Generación de vídeo|Subtítulos AI|Extracción de audio|Conversión de voz en texto

Introducción completa Record Cafe es una plataforma integral de procesamiento de audio/vídeo que proporciona servicios de diálogo de vídeo AI, subtítulos AI y conversión de voz a texto AI. Las funciones incluyen grabación de pantalla, edición de vídeo, conversión de GIF/audio, etc., y admite almacenamiento y uso compartido en la nube. La interfaz es intuitiva y fácil de usar, y también es compatible con la grabación multi-pantalla y multi-lenguaje inteligente ...

Últimos recursos sobre IA # AI de texto a vídeo # AI texto a voz # AI Voz a texto

hace 1 año

067K

CrisperWhisper: herramienta de transcripción literal de discursos precisos

Descripción general CrisperWhisper es una herramienta avanzada de reconocimiento de voz basada en OpenAI Whisper que se centra en la transcripción de voz rápida, precisa y palabra por palabra. Proporciona marcas de tiempo precisas a nivel de palabra, incluso con rellenos y pausas del habla....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

071.5K

Babelfish.ai: aplicación de transcripción y traducción de voz en tiempo real para navegadores

Introducción general Babelfish.ai es una aplicación de transcripción y traducción en tiempo real construida sobre Huggingface Transformer.js y Supabase Realtime. La aplicación puede cargar grandes modelos en el navegador y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 2 años

053.2K

FreeTTS: Herramienta gratuita de conversión de texto a voz en línea|Mejora de audio|Clips de audio

FreeTTS Descripción general FreeTTS es una herramienta gratuita de conversión de texto a voz en línea que permite a los usuarios convertir texto en archivos de voz con sonido natural. Con soporte para múltiples idiomas y opciones de sonido, los usuarios pueden convertir texto a formatos MP3, WAV, OGG y ACC...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto # AI editor de audio/vídeo

hace 2 años

068.9K

Easy Voice Toolkit: kit de herramientas de voz AI para implantación local

Introducción exhaustiva Easy-Voice-Toolkit es un conjunto de herramientas multifuncionales basado en el Open Source Speech Project, que proporciona una amplia gama de herramientas de audio automatizadas para el reconocimiento del habla, la transcripción del habla, la conversión del habla, la creación de conjuntos de datos y el entrenamiento de modelos. Los usuarios pueden utilizar estas herramientas de forma selectiva según sus necesidades...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # Clonación de voz AI

hace 2 años

063.9K

DupDub: editor de vídeo con inteligencia artificial | doblaje | traducción de vídeo | digitalizador de fotos

Descripción general Dupdub es una plataforma de creación de podcasts y presentaciones de vídeo que ofrece una serie de herramientas de IA para apoyar la creatividad de los usuarios. Sus funciones abarcan la creación de texto a vídeo, ofreciendo servicios de doblaje de voz y vídeo con IA, así como edición de vídeo, transcripción y subtitulación. Dupdub es también ...

Últimos recursos sobre IA # AI Digital Man # AI texto a voz # AI Voz a texto

hace 2 años

055.2K

Tongyi Listening and Understanding: Ali Tongyi Asistente de Inteligencia Artificial para la transcripción de contenidos de audio y vídeo

Introducción exhaustiva Tongyi Listening and Understanding es un asistente de IA para el trabajo lanzado por Aliyun, centrado en la transcripción y el análisis de contenidos de audio y vídeo. Se basa en los potentes modelos de IA de AliCloud para transcribir contenido de audio y vídeo a texto en tiempo real, y proporciona funciones de traducción, resumen, posicionamiento y otras. Tongyi Listening Woo es compatible con varios idiomas y escenarios...

Últimos recursos sobre IA # Herramienta AI de resumen de texto y audio/vídeo # AI Voz a texto

hace 2 años

067.9K

Insanely Fast Whisper: proyecto de código abierto para la transcripción rápida y eficaz de voz a texto

Introducción completa insanely-fast-whisper es una transferencia de audio que combina el modelo Whisper de OpenAI con diversas técnicas de optimización (por ejemplo, Transformers, Optimum, Flash Attention...)

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

069.7K

Memo AI: Cliente nativo de vídeo a subtítulos, conversión de subtítulos multilingües

Descripción general MemoAI es una potente herramienta de traducción de vídeo diseñada para convertir archivos de vídeo y audio en texto, subtítulos y notas. Ya sea un vídeo de YouTube, un podcast o un archivo local, MemoAI puede manejarlo con facilidad. Es compatible con más de 90 idiomas como chino, inglés, japonés...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto # AI editor de audio/vídeo

hace 1 año

066.1K

pyvideotrans: Herramienta de doblaje para la traducción de vídeos

pyVideoTrans Introducción general pyvideotrans es una herramienta de traducción y doblaje de vídeo. Los usuarios pueden traducir contenidos de vídeo de un idioma a otro, y añadir el doblaje y los subtítulos adecuados al vídeo. Se basa en openai-whisper offline...

Últimos recursos sobre IA # AI texto a voz # AI Voz a texto # AI editor de audio/vídeo

hace 2 años

083.3K

No es eso.