Descrição geral O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar uma fala realista e semelhante à humana e transcrever áudio em texto.
Introdução geral O Weights é uma plataforma social para criatividade usando IA que permite aos usuários criar capas de voz, conversão de texto em fala, imagens, músicas e vídeos com ações simples. A plataforma oferece uma grande variedade de ferramentas e modelos para ajudar os usuários a começar a criar rapidamente e compartilhar seu trabalho com a comunidade....
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução geral O AnyVoice é uma plataforma avançada de geração de fala com IA que oferece serviços de geração de fala e clonagem de voz ultrarrealistas. A plataforma permite que os usuários convertam texto em fala natural e escolham entre centenas de vozes predefinidas. Se você não conseguir encontrar a voz certa, basta gravar 3 segundos...
Introdução geral O Open NotebookLM é um projeto de código aberto desenvolvido para converter qualquer documento PDF em um podcast. A ferramenta usa modelos de código aberto Large Language Model (LLM) e Text-to-Speech (TTS) para processar o conteúdo do PDF, gerar diálogos naturais adequados para podcasts de áudio e gerar arquivos MP3. O projeto conta com o apoio da N...
Introdução geral O Llasa-3B é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong (HKUST Audio). O modelo é baseado na arquitetura Llama 3.2B, que foi cuidadosamente ajustada para fornecer geração de fala de alta qualidade que não só suporta vários idiomas, mas também permite a expressão emocional e a personalidade...
Introdução geral O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido por thewh1teagle, o projeto tem como objetivo fornecer soluções eficientes e rápidas de síntese de fala. O Kokoro-ONNX é compatível com vários idiomas, inclusive inglês, e planeja oferecer suporte a francês, japonês, coreano...
Introdução geral O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem uma saída de fala de alta qualidade.
Introdução geral O Jellypod é um poderoso estúdio de podcast de IA projetado para ajudar os usuários a criar, editar e publicar facilmente podcasts de IA de alta qualidade. Com o Jellypod, os usuários podem criar hosts de podcast personalizados, refinar scripts e publicar podcasts no Spotify, YouTube, Apple P...
Introdução geral O sherpa-onnx é um projeto de código aberto desenvolvido pela equipe do Next-gen Kaldi para fornecer soluções eficientes de reconhecimento e síntese de fala off-line. Ele é compatível com uma variedade de plataformas, incluindo Android, iOS, Raspberry Pi etc., e pode ser usado na ausência de conectividade de rede em tempo real...
Introdução geral O Audiblez é um projeto de código aberto desenvolvido para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e vozes. Os usuários podem converter eBooks com uma simples linha de comando ...
A Acoust é uma plataforma on-line de geração de voz com IA e de serviços de conversão de texto em fala (TTS) que usa a mais recente tecnologia de IA para gerar fala realista. A plataforma também oferece ferramentas avançadas de edição de vídeo que permitem aos usuários criar vídeos sem a necessidade de usar vários softwares.
Introdução abrangente O Kokoro-FastAPI é um pacote FastAPI baseado no Docker projetado para oferecer suporte ao modelo de conversão de texto em fala Kokoro-82M. O projeto é compatível com a aceleração da GPU NVIDIA e fornece processamento de filas e emenda automática para tornar a saída de fala do texto adulto bruto mais eficiente e coerente. O projeto ...
Introdução geral O Kokoro 82M é um modelo eficiente de síntese de fala fornecido pela Hugging Face, projetado para gerar fala de alta qualidade com menos parâmetros e dados. O modelo tem 82 milhões de parâmetros, é distribuído sob a licença Apache 2.0, suporta uma ampla variedade de pacotes de voz (Voicepacks) e pode gerar...
Introdução geral O ebook2audiobook é uma poderosa ferramenta de código aberto de ebook para audiolivro. Ela é capaz de converter vários formatos de livros eletrônicos em audiolivros com marcadores de capítulos e metadados completos. A ferramenta usa o Calibre para a conversão de formato de e-book, usando o XTTSv2 da Coqui e o Fairseq...
Introdução geral O Edge TTS Worker (depende do edge-tts) é um serviço de proxy implantado no Cloudflare Worker que encapsula o serviço Microsoft Edge TTS em uma interface de API compatível com o formato OpenAI. Com esse projeto, os usuários podem usar facilmente sem a certificação da Microsoft...
Introdução abrangente A ViiTor AI é uma poderosa plataforma de inteligência artificial focada em fornecer serviços de tradução de vídeo de alta qualidade, clonagem de voz, vídeos de avatar gerados por IA e síntese de fala. A plataforma é compatível com vários idiomas e foi projetada para ajudar os usuários a criar conteúdo multilíngue com facilidade.
Introdução abrangente A Wondercraft é uma plataforma revolucionária de criação de áudio/vídeo orientada por IA que oferece aos criadores de conteúdo uma solução completa de produção de áudio/vídeo. A plataforma usa tecnologia avançada de IA para converter conteúdo de texto em fala natural e suave, suporta mais de 20 idiomas e oferece mais de 200 recursos de IA...
Introdução geral O NotebookLM Podcast é uma plataforma inovadora que utiliza tecnologia de inteligência artificial para transformar qualquer conteúdo textual em podcasts de áudio dinâmicos e envolventes. Seja você um estudante, educador, criador de conteúdo ou profissional ocupado, o NotebookLM Podcast oferece uma experiência personalizada...
Introdução geral O AivisSpeech é um software de síntese de fala japonesa baseado na interface de usuário do editor VOICEVOX. Ele integra o AivisSpeech Engine, que facilita a geração de discursos emocionalmente ricos. O AivisSpeech oferece suporte a uma ampla variedade de modelos de síntese de som, permitindo que os usuários gerem...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.