AI Speech to Text

Total de 56 artigos

organizar em ordem

Sherpa-ONNX: reconhecimento e síntese de fala off-line com o ONNXRuntime

Introdução geral O sherpa-onnx é um projeto de código aberto desenvolvido pela equipe do Next-gen Kaldi para fornecer soluções eficientes de reconhecimento e síntese de fala off-line. Ele é compatível com várias plataformas, incluindo Android, iOS, Raspber...

7 meses atrás

06.5K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

SoniTranslate: solução de dublagem de tradução de vídeo de código aberto, dublagem múltipla, ajuste de velocidade e imitação do som original

Descrição geral O SoniTranslate é uma ferramenta de dublagem multilíngue de vídeo avançada e fácil de usar, projetada para fornecer uma solução de tradução de vídeo e áudio sincronizado. Ele usa tecnologias avançadas de reconhecimento de fala e tradução automática para traduzir o conteúdo do vídeo em vários idiomas e manter o áudio sincronizado. O ...

Recursos mais recentes de IA # Conversão de texto em fala com IA Tradução de IA ## AI Conversão de fala em texto

10 meses atrás

06.1K

Aqua Voice: entrada de voz entre aplicativos para gerar texto preciso

Introdução geral O Aqua Voice é uma ferramenta inteligente de geração de texto baseada em fala, focada na conversão rápida da fala do usuário em texto formatado. Ela foi criada em 2023 por Finnian Brown e Jack McIntire e está sediada nos Estados Unidos...

Recursos mais recentes de IA # AI Conversão de fala em texto

4 meses atrás

04.8K

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换

Zamzar: ferramenta on-line multifuncional de conversão de formatos de arquivos, conversão de vídeo, conversão de áudio, conversão de imagens, conversão de documentos

Introdução geral O Zamzar é uma poderosa ferramenta de conversão de arquivos on-line que suporta mais de 1.200 formatos de arquivos. Quer se trate de documentos, imagens, vídeos, áudios ou livros eletrônicos, o Zamzar pode fazer isso de forma rápida e eficiente. Os usuários não precisam fazer download de nenhum software...

Recursos mais recentes de IA # Serviços abertos de IA # AI Conversão de fala em texto

10 meses atrás

04.8K

FreeTTS: Ferramenta on-line gratuita de conversão de texto em fala|Aumento de áudio|Clipes de áudio

FreeTTS Descrição geral O FreeTTS é uma ferramenta on-line gratuita de conversão de texto em fala que permite aos usuários converter texto em arquivos de voz com som natural. Com suporte a vários idiomas e opções de som, os usuários podem converter texto nos formatos MP3, WAV, OGG e ACC...

Recursos mais recentes de IA # Conversão de texto em fala com IA # AI Conversão de fala em texto Editor de áudio/vídeo # AI

11 meses atrás

04.7K

FunASR: kit de ferramentas de reconhecimento de fala de código aberto, separação de locutor / reconhecimento de fala de diálogo com várias pessoas

Introdução abrangente O FunASR é um kit de ferramentas de reconhecimento de fala de código aberto desenvolvido pelo Alibaba Dharma Institute, com o objetivo de unir pesquisa acadêmica e aplicações industriais. Ele suporta uma ampla gama de recursos de reconhecimento de fala, incluindo reconhecimento de fala (ASR), detecção de ponto final de voz (VAD), recuperação de pontuação, modelagem de linguagem, fala...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

10 meses atrás

04.7K

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop

Whisper GPGPU: OpenAI Whisper em execução no Windows|Whisperdesktop

Introdução geral O Whisper é um projeto de código aberto do GitHub desenvolvido pela Const-me que se concentra na inferência de alto desempenho do modelo de reconhecimento automático de fala (ASR) Whisper da OpenAI usando GPGPU. Esse projeto é baseado na licença MPL-2.0...

Recursos mais recentes de IA # AI Conversão de fala em texto

10 meses atrás

04.6K

LLPlayer: reprodutor de vídeo que gera legendas em tempo real com tradução bilíngue

Introdução geral O LLPlayer é um reprodutor de mídia de código aberto para alunos de idiomas, hospedado no GitHub e criado pelo desenvolvedor umlx5h. Ele integra uma variedade de recursos úteis, como exibição de legendas bilíngues, legendas geradas automaticamente por IA, tradução em tempo real e pesquisa de palavras...

Recursos mais recentes de IA # Projeto de código aberto AI Java Tradução de IA ## AI Conversão de fala em texto

2 meses atrás

04.4K

CrisperWhisper: Ferramenta de transcrição exata e fiel da fala

Descrição geral O CrisperWhisper é uma ferramenta avançada de reconhecimento de fala baseada no OpenAI Whisper que se concentra na transcrição de fala rápida, precisa e palavra por palavra. Ele fornece registros de data e hora precisos em nível de palavra, mesmo com preenchimentos e pausas na fala...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

7 meses atrás

04.3K

AsrTools: ferramenta de fala para legenda, cliente leve com interfaces integradas para Cutscene, Racer e Must-Cut

Introdução abrangente O AsrTools é uma ferramenta inteligente de conversão de voz em texto com interfaces integradas de grandes empresas, como Cutscene, QuickScope, MustCut etc. Não requer GPU nem configuração complicada e oferece suporte ao processamento eficiente de lotes com vários threads. Baseia-se no desenvolvimento do PyQt5, com uma interface bonita e amigável, capaz de gerar palavras nos formatos SRT e TXT...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

10 meses atrás

04.2K

Buzz: ferramenta de tradução de transcrição de áudio off-line de código aberto | transcrição de voz para IOS

Buzz Introdução geral O Buzz é um projeto de código aberto criado por chidiwilliams que permite a transcrição e a tradução off-line de áudio em computadores pessoais. O projeto se baseia na tecnologia Whisper da OpenAI, que permite que os usuários não dependam de uma conexão com a Internet para o texto de áudio...

Recursos mais recentes de IA # AI Conversão de fala em texto

10 meses atrás

04.2K

Murf AI: Modificador de voz|Fala para texto|Texto para fala|Editor de áudio

Introdução geral O Murf AI é uma poderosa ferramenta on-line de geração de voz de inteligência artificial que converte texto em fala humana quase real. Ela oferece até 120+ opções de voz de IA, suporta mais de 20 idiomas e é adequada para uma variedade de situações, como podcasts, vídeos, apresentações profissionais etc.

Recursos mais recentes de IA # Conversão de texto em fala com IA # AI Conversão de fala em texto

10 meses atrás

04.2K

Memo AI: cliente nativo para conversão de vídeo em legenda, convertendo legendas multilíngues

Descrição geral O MemoAI é uma poderosa ferramenta de tradução de vídeo projetada para converter arquivos de vídeo e áudio em texto, legendas e notas. Seja um vídeo do YouTube, um podcast ou um arquivo local, o MemoAI pode lidar com isso com facilidade. Ele suporta mais de 90 idiomas, como chinês, inglês, japonês...

Recursos mais recentes de IA # Conversão de texto em fala com IA # AI Conversão de fala em texto Editor de áudio/vídeo # AI

8 meses atrás

04.1K

FunClip: edição inteligente de conteúdo de vídeo em curtas-metragens, fácil de obter extração/corte precisos de clipes de vídeo

Introdução abrangente O FunClip é uma ferramenta de edição de vídeo automatizada, localizada e de código aberto, desenvolvida pelo TONGYI Speech Lab do Alibaba Dharma Institute. A ferramenta integra o modelo de reconhecimento de fala Paraformer-Large de nível industrial, que pode identificar com precisão a fala no vídeo...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto Editor de áudio/vídeo # AI

7 meses atrás

04K

Happy Scribe: Plataforma de transcrição de áudio e legendagem de vídeo | Software gratuito de legendagem de vídeo

Happy Scribe Descrição geral O Happy Scribe oferece serviços de transcrição de áudio automatizada e manual para converter áudio em texto com alta precisão e suporte a vários idiomas e formatos. Ele inclui um editor interativo, ferramentas de colaboração, vários formatos de exportação, tradução automática e outros recursos...

Recursos mais recentes de IA # AI Conversão de fala em texto Editor de áudio/vídeo # AI

10 meses atrás

03.9K

ALog: aplicativo portátil de diário de voz com IA e suporte de fala para texto.

Introdução geral O ALog é um aplicativo de diário de voz baseado em IA projetado para ajudar os usuários a registrar suas vidas diárias por voz. Ele foi desenvolvido pela duxins e tem código aberto no GitHub. Os usuários podem gravar entradas de diário por meio de entrada de voz, e o aplicativo converterá automaticamente a voz em texto...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

7 meses atrás

03.8K

pyvideotrans: ferramenta de dublagem de tradução de vídeo

pyVideoTrans Introdução geral O pyvideotrans é uma ferramenta de dublagem de tradução de vídeo. Os usuários podem traduzir o conteúdo do vídeo de um idioma para outro e adicionar a dublagem e as legendas apropriadas ao vídeo. Ele é baseado no openai-whisper off-line...

Recursos mais recentes de IA # Conversão de texto em fala com IA # AI Conversão de fala em texto Editor de áudio/vídeo # AI

1 ano atrás

03.7K

Deepgram: API de serviço para soluções de reconhecimento e síntese de fala de alta precisão

Descrição geral A Deepgram é uma empresa especializada em tecnologias de reconhecimento de fala e processamento de linguagem natural, oferecendo APIs avançadas de fala para texto e texto para fala.

Recursos mais recentes de IA # Serviços abertos de IA # AI Conversão de fala em texto

5 meses atrás

03.5K

Notta: ferramenta de transcrição de áudio e gravação de reuniões com IA para transcrever automaticamente reuniões, entrevistas ou gravações

Descrição geral O Notta é uma poderosa ferramenta de transcrição de áudio e gravação de reuniões com IA projetada para ajudar os usuários a converter automaticamente reuniões, entrevistas ou gravações de áudio em texto pesquisável. Com o Notta, os usuários podem facilmente transcrever, editar, resumir e colaborar para aumentar a produtividade.

Recursos mais recentes de IA # Ferramenta de resumo de texto e áudio/vídeo com IA # AI Conversão de fala em texto

7 meses atrás

03.5K

Record Cafe: plataforma completa de processamento de áudio/vídeo|geração de vídeo|legenda de IA|extração de áudio|fala para texto

Introdução abrangente O Record Cafe é uma plataforma completa de processamento de áudio/vídeo que oferece serviços de diálogo em vídeo com IA, legendas com IA e fala com IA para texto. As funções incluem gravação de tela, edição de vídeo, conversão de GIF/áudio, etc., e suporta armazenamento e compartilhamento em nuvem. A interface é intuitiva e fácil de usar, além de oferecer suporte à gravação em várias telas e ao uso inteligente em vários idiomas...

Recursos mais recentes de IA # Texto de IA para vídeo # Conversão de texto em fala com IA # AI Conversão de fala em texto

8 meses atrás

03.5K

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

Introdução abrangente O Easy-Voice-Toolkit é um kit de ferramentas multifuncional baseado no Open Source Speech Project, que oferece uma ampla variedade de ferramentas de áudio automatizadas para reconhecimento de fala, transcrição de fala, conversão de fala, criação de conjuntos de dados e treinamento de modelos. Os usuários podem usar essas ferramentas de forma seletiva, conforme necessário...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA Clonagem de voz do # AI

11 meses atrás

03.5K

Insanely Fast Whisper: projeto de código aberto de transcrição rápida e eficiente de fala para texto

Introdução abrangente O insanely-fast-whisper é uma transferência de áudio que combina o modelo Whisper da OpenAI com várias técnicas de otimização (por exemplo, Transformers, Optimum, Flash Attention)...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

7 meses atrás

03.5K

DupDub: editor de vídeo com inteligência artificial|dublagem|tradução de vídeo|digitalizador de fotos

Descrição geral O Dupdub é uma plataforma de criação de podcast e apresentação de vídeo que oferece uma variedade de ferramentas de IA para apoiar a criatividade dos usuários. Os recursos abrangem a criação de texto para vídeo, oferecendo serviços de dublagem de voz e vídeo com IA, bem como edição, transcrição e legendagem de vídeo. A Dupdub também é ...

Recursos mais recentes de IA # AI Digital Man # Conversão de texto em fala com IA # AI Conversão de fala em texto

12 meses atrás

03.5K

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Voice-Pro: ferramenta de tradução de vídeo multifuncional de código aberto, transcrição e tradução de voz em vários idiomas, instalação com um clique no Windows

Introdução geral O Voice-Pro é uma ferramenta versátil baseada na Gradio WebUI que oferece suporte a conversão de fala em texto, conversão de texto em fala, tradução em tempo real, downloads de vídeos do YouTube e separação de voz humana. Ele integra o Whisper, o Faster-Wh...

Recursos mais recentes de IA # Projeto de código aberto AI Java Tradução de IA ## AI Conversão de fala em texto

9 meses atrás

03.4K

Tongyi Listening and Understanding: Assistente de IA para transcrição de conteúdo de áudio e vídeo do Ali Tongyi

Introdução abrangente O Tongyi Listening and Understanding é um assistente de IA para trabalho-estudo lançado pela Aliyun, com foco na transcrição e análise de conteúdo de áudio e vídeo. Ele se baseia nos poderosos modelos de IA do AliCloud para transcrever conteúdo de áudio e vídeo em texto em tempo real, além de oferecer tradução, resumo, posicionamento e outras funções. O Tongyi Listening Woo é compatível com vários idiomas e cenários...

Recursos mais recentes de IA # Ferramenta de resumo de texto e áudio/vídeo com IA # AI Conversão de fala em texto

12 meses atrás

03.4K

AI Hear: software de transcrição e tradução de fala em tempo real que funciona nativamente off-line

Descrição geral Se estiver usando um MacBook, experimente o AI Hear: você pode gravar áudio, converter fala local em tempo real em texto, traduzir e, eventualmente, exportar legendas. Você pode usá-lo para ajudá-lo a ouvir reuniões entre países e audiolivros em inglês. O AI Hear é um software executado localmente que fornece fala em tempo real com um clique...

Recursos mais recentes de IA Tradução de IA ## AI Conversão de fala em texto

9 meses atrás

03.4K

BetterWhisperX: reconhecimento automático de fala separado do alto-falante, fornecendo registros de tempo altamente precisos no nível da palavra

Introdução geral O BetterWhisperX é uma versão otimizada do projeto WhisperX, com foco no fornecimento de serviços de reconhecimento automático de fala (ASR) eficientes e precisos. Como um desdobramento aprimorado do WhisperX, o projeto foi desenvolvido por Federico ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

8 meses atrás

03.3K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT: ferramenta de conversão de fala em texto em tempo real para reconhecimento de fala em streaming de baixa latência com base no Whisper

Introdução geral O RealtimeSTT é uma biblioteca de conversão de fala em texto eficiente e de baixa latência em tempo real, com detecção avançada de atividade de fala e ativação de palavras de alerta. Ela foi desenvolvida por Kolja Beigel para dar suporte a aplicativos que exigem conversão de fala em texto rápida e precisa...

Notícias sobre IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

7 meses atrás

03.2K

VideoLingo：视频转录单词级时间轴字幕，视频字幕翻译和本地化配音开源工具

VideoLingo: transcrição de vídeo, legendas de linha do tempo em nível de palavra, tradução de legendas de vídeo e ferramentas de código aberto para dublagem localizada

Descrição geral O VideoLingo é uma ferramenta completa de tradução de vídeo e dublagem de localização, projetada para gerar legendas de alta qualidade para a Netflix, eliminando a tradução automática bruta e as legendas de várias linhas e adicionando dublagens de alta qualidade para permitir que o conhecimento global seja compartilhado além das barreiras linguísticas. Por...

Recursos mais recentes de IA # Projeto de ganho de dinheiro com a IA Tradução de IA ## AI Conversão de fala em texto

10 meses atrás

03.2K

Freed: assistente de transcrição médica com IA que transcreve com precisão as conversas entre médico e paciente e reduz a papelada de documentação da consulta

Descrição geral O Freed é um assistente de transcrição médica com IA projetado para profissionais de saúde. Ele ajuda os médicos e outros profissionais de saúde a automatizar o registro das visitas dos pacientes, reduzir a burocracia e melhorar a eficiência do trabalho por meio da tecnologia avançada de IA...

Recursos mais recentes de IA # AI Conversão de fala em texto

8 meses atrás

03.2K

Orate: uma API unificada para integrar a geração de fala, a transcrição de fala e a modelagem de voz do Well-Known

Introdução geral O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA # AI Conversão de fala em texto

6 meses atrás

03.1K

Babelfish.ai: aplicativo de tradução e transcrição de fala em tempo real executado pelo navegador

Introdução geral O Babelfish.ai é um aplicativo de transcrição e tradução em tempo real criado com base no Huggingface Transformer.js e no Supabase Realtime. O aplicativo pode carregar modelos grandes no navegador e...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

11 meses atrás

03.1K

Ferramenta de código aberto para conversão de fala em texto em tempo real

Introdução geral O realtime-transcription-fastrtc é um projeto de código aberto voltado para a conversão de fala em texto em tempo real. Ele usa a tecnologia FastRTC para processar fluxos de áudio de baixa latência, combinada com um modelo Whisper local para obter eficiência ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

4 meses atrás

03K

Voicenotes: anotações de voz com IA, gravação e transcrição de voz, gerenciamento inteligente do conteúdo da reunião

Introdução geral O Voicenotes é um aplicativo inteligente de anotações de voz projetado para ajudar os usuários a gravar e gerenciar facilmente anotações de voz e reuniões. O aplicativo suporta transcrição de voz em mais de 100 idiomas. Os usuários simplesmente falam seus pensamentos e o Voicenotes os transcreve automaticamente em texto...

Recursos mais recentes de IA Notas de IA do ## AI Conversão de fala em texto

8 meses atrás

03K

Transkriptor: a ferramenta de transcrição inteligente de IA que transforma áudio e vídeo em texto

Introdução geral O Transkriptor é uma ferramenta de transcrição orientada por IA que se concentra na conversão rápida de áudio e vídeo em texto. Ele suporta mais de 100 idiomas com uma taxa de precisão de até 99% e é adequado para uma ampla gama de cenários, como reuniões, entrevistas, anotações em sala de aula e muito mais. Os usuários podem fazer upload de arquivos,...

Recursos mais recentes de IA # Ferramenta de resumo de texto e áudio/vídeo com IA Tradução de IA ## AI Conversão de fala em texto

4 meses atrás

02.9K

FireRedASR: um modelo de código aberto para reconhecimento de fala multilíngue de alta precisão

Introdução geral O FireRedASR é um modelo de reconhecimento de fala desenvolvido e de código aberto pela equipe do Little Red Book FireRed, com foco no fornecimento de soluções de reconhecimento automático de fala (ASR) de alta precisão e com suporte a vários idiomas. O projeto está hospedado no GitHub para desenvolvedores e pesquisadores, e oferece...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

5 meses atrás

02.9K

Wispr Flow: use sua voz para digitar texto rapidamente em qualquer aplicativo

Descrição geral O Wispr Flow é uma ferramenta para inserir texto por voz, ajudando os usuários a escrever rapidamente em seus computadores. É uma experiência "3x mais rápida do que digitar" que permite aos usuários inserir texto em qualquer aplicativo, como Word, Slack ou G...

Recursos mais recentes de IA # AI Conversão de fala em texto

2 meses atrás

02.9K

AudioNotes: extraia rapidamente o conteúdo de áudio e vídeo e gere notas estruturadas

Introdução abrangente O AudioNotes é um sistema de notas estruturadas de áudio/vídeo desenvolvido com base no FunASR e no Qwen2. Ele pode extrair rapidamente o conteúdo de áudio/vídeo e chamar o grande modelo para gerar notas estruturadas em Markdown, o que é conveniente para...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

6 meses atrás

02.9K

Reunião: transcrição local em tempo real e geração de atas de reunião do cliente de código aberto

Introdução geral O Meeting Minutes (também conhecido como Meetily) é uma ferramenta de assistente de reunião de IA gratuita e de código aberto desenvolvida pela Zackriya Solutions, focada na captura de áudio de reuniões em tempo real, na geração de texto transcrito e na extração automática de...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ferramenta de resumo de texto e áudio/vídeo com IA # AI Conversão de fala em texto

5 meses atrás

02.9K

WhisperChain: conversão de voz em texto em tempo real e otimização de palavras faladas

Introdução geral O WhisperChain é um projeto de código aberto baseado em IA hospedado no GitHub e liderado pelo desenvolvedor Chris Choy. Ele é usado principalmente para converter fala em texto e otimizar automaticamente a expressão por meio da tecnologia de IA, removendo redundâncias...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

5 meses atrás

02.8K

TurboScribe: a ferramenta on-line para conversão rápida de áudio e vídeo em texto

Descrição geral O TurboScribe é uma ferramenta de transcrição baseada em IA que se concentra na conversão rápida de áudio e vídeo em texto. Ele suporta mais de 98 idiomas com uma taxa de precisão de 99,8% para usuários que precisam processar conteúdo de voz com eficiência. Os usuários podem fazer upload de arquivos, gerar notas de texto...

Recursos mais recentes de IA # AI Conversão de fala em texto

4 meses atrás

02.7K

Local-NotebookLM: PDF local para gerar podcasts de voz de ferramentas de código aberto

Introdução geral O Local-NotebookLM é um projeto de código aberto, cujo objetivo é fornecer ferramentas inteligentes de processamento de documentos e geração de conteúdo executadas localmente. Ele é inspirado no Google NotebookLM, com foco em ajudar os usuários a transformar PDFs e outros documentos em uma variedade de ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

5 meses atrás

02.7K

Vexa: uma ferramenta inteligente de extração de conhecimento e transcrição de reuniões em tempo real

Introdução abrangente O Vexa é uma plataforma de código aberto de transcrição de reuniões em tempo real e de gerenciamento de conhecimento projetada para fornecer serviços eficientes de gravação de reuniões e extração inteligente de conhecimento para empresas e indivíduos. Ele se une automaticamente a plataformas como Google Meet, Zoom etc. por meio de robôs de reunião orientados por API...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ferramenta de resumo de texto e áudio/vídeo com IA # AI Conversão de fala em texto

4 meses atrás

02.7K

Kimi-Audio: processamento de áudio de código aberto e modelo de base de diálogo

Introdução geral O Kimi-Audio é um modelo de base de áudio de código aberto desenvolvido pela Moonshot AI, com foco na compreensão, geração e diálogo de áudio. Ele oferece suporte a uma ampla gama de tarefas de processamento de áudio, como reconhecimento de fala, P&R de áudio e reconhecimento de emoção de fala. O modelo foi testado em mais de 130...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA # AI Conversão de fala em texto

3 meses atrás

02.7K

LiberSonora: extração de legendas de audiolivros e tradução multilíngue, transcrição de audiolivros em vários idiomas

Introdução abrangente O LiberSonora, que significa "som livre", é um poderoso conjunto de ferramentas de audiolivro de código aberto habilitado para IA. Ele oferece suporte à extração inteligente de legendas, geração de títulos com IA, tradução em vários idiomas etc., e é capaz de processar off-line em lote com aceleração de GPU.

Recursos mais recentes de IA # Projeto de código aberto AI Java Tradução de IA ## AI Conversão de fala em texto

6 meses atrás

02.7K

AI no jimaku gumi: geração e tradução automáticas de legendas multilíngues para vídeos com a ajuda da IA

Introdução geral O AI no jimaku gumi (AI no subtitle group) é uma poderosa ferramenta de processamento de legendas de vídeo de linha de comando, cujo foco é permitir funções automatizadas de extração, transcrição e tradução de legendas de vídeo. A ferramenta integra tecnologias avançadas de IA, incluindo a fala Whisper...

Recursos mais recentes de IA # Projeto de código aberto AI Java Tradução de IA ## AI Conversão de fala em texto

7 meses atrás

02.6K

Whisper Input: um serviço de transcrição de voz para texto gratuito e de alta velocidade que usa o Groq

Descrição geral O Whisper Input é uma ferramenta de transcrição de voz de código aberto que permite aos usuários iniciar a gravação de voz pressionando o botão Option e encerrar a gravação levantando o botão. A ferramenta chama o Groq Whisper Large V3 Turbo ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

6 meses atrás

02.6K

Acoust: plataformas de serviços de geração de fala com IA on-line e de conversão de texto em fala (TTS)

Introdução geral O Acoust é uma plataforma de serviços de geração de fala com IA on-line e de conversão de texto em fala (TTS) que usa a mais recente tecnologia de IA para gerar uma fala realista. A plataforma também oferece ferramentas avançadas de edição de vídeo que permitem aos usuários concluir a produção de vídeo sem a necessidade de vários softwares.

Recursos mais recentes de IA # Conversão de texto em fala com IA # AI Conversão de fala em texto

7 meses atrás

02.6K

CapsWriter-Offline: ferramenta de entrada de fala e transcrição de legendas para PC

Introdução geral O CapsWriter-Offline é uma ferramenta de transcrição de legendas e entrada de voz para PC, hospedada no GitHub e criada pelo desenvolvedor HaujetZhao. Ele é executado totalmente off-line e não requer conexão com a Internet para conversão de voz em texto e...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

6 meses atrás

02.6K

On Device AI: ferramenta de transcrição de voz e bate-papo com IA para execução nativa do iPhone

Introdução geral O On-Device AI é um aplicativo de IA que funciona totalmente off-line, projetado para dispositivos Apple, compatível com iOS, macOS e visionOS. Ele fornece execução local de modelo de linguagem em grande escala (LLM), transcrição de fala em tempo real, análise de documentos e muito mais, sem a necessidade de vincular...

Recursos mais recentes de IA # Aplicativo de bate-papo localizado com IA # AI Conversão de fala em texto

3 meses atrás

02.5K

Otter.ai: assistente de reunião inteligente com ferramenta de transcrição de voz em tempo real

Descrição geral O Otter.ai é uma ferramenta de transcrição de voz e gerenciamento de reuniões com tecnologia de IA, com funcionalidade central para converter voz em texto em tempo real e gerar automaticamente notas de reunião, resumos e itens de ação. Ele conta com o suporte inteligente de um agente de reunião de IA que adiciona automaticamente...

Recursos mais recentes de IA # Ferramenta de resumo de texto e áudio/vídeo com IA # AI Conversão de fala em texto

4 meses atrás

02.5K

AssemblyAI: Plataforma de análise de inteligência de áudio e fala para texto de alta precisão

Introdução geral A AssemblyAI é uma plataforma focada na tecnologia de IA de fala, fornecendo aos desenvolvedores e às empresas ferramentas eficientes de análise de fala para texto e áudio. Seu principal destaque é a família de modelos Universal, especialmente o recém-lançado Universal-2...

Recursos mais recentes de IA # Serviços abertos de IA # AI Conversão de fala em texto

5 meses atrás

02.5K

TwinMind: aplicativo gratuito de transcrição de voz para texto off-line

O TwinMind é uma ferramenta inteligente desenvolvida pela ThirdEar AI, Inc. que "ajuda você a se lembrar de tudo". Ele pode gravar e converter conversas, reuniões ou palestras em texto em tempo real, em mais de 100 idiomas, mesmo com o telefone no bolso, e...

Recursos mais recentes de IA # Ferramenta de resumo de texto e áudio/vídeo com IA # AI Conversão de fala em texto

4 meses atrás

02.5K

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: ferramenta de conversão de fala em texto multilíngue menor e mais rápida que o Whisper-Large v3

Introdução abrangente O PengChengStarling (PengCheng Labs) é uma ferramenta de reconhecimento automático de fala (ASR) multilíngue capaz de converter a fala em diferentes idiomas em texto correspondente. Esse kit de ferramentas foi desenvolvido com base no projeto icefall e fornece um processo completo de reconhecimento de fala...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

6 meses atrás

02.5K

Abogen: uma ferramenta para converter vários formatos de texto em audiolivros

Introdução geral O Abogen é uma ferramenta de código aberto projetada para converter rapidamente arquivos ePub, PDF ou de texto simples em áudio de alta qualidade. Ele usa o modelo Kokoro-82M para gerar uma fala natural e suave e oferece suporte à geração simultânea de legendas, o que é adequado para a produção de audiolivros...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

3 meses atrás

02.3K

Dolphin: reconhecimento de idiomas asiáticos e modelagem de fala para texto para idiomas asiáticos

Introdução abrangente O Dolphin é um modelo de código aberto desenvolvido pela DataoceanAI e pela Universidade de Tsinghua, com foco no reconhecimento de fala e de idioma para idiomas asiáticos. Ele é compatível com 40 idiomas do Leste Asiático, Sul da Ásia, Sudeste Asiático e Oriente Médio, além de 22 dialetos chineses...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

4 meses atrás

02.2K

Não é isso.