Introdução abrangente O csm-mlx é baseado na estrutura MLX desenvolvida pela Apple, otimizada especificamente para o modelo de diálogo de fala CSM (Conversation Speech Model) da Apple Silicon (Apple Silicon). Esse projeto permite que os usuários executem uma geração de fala eficiente em dispositivos Apple de forma simples e...
Introdução geral O Autiobooks é uma ferramenta de código aberto criada para ajudar os usuários a converter rapidamente livros eletrônicos no formato .epub em audiolivros no formato .m4b. Ela usa tecnologia de síntese de fala de alta qualidade fornecida pela Kokoro para gerar áudio natural e suave. A ferramenta foi desenvolvida por David Nesbitt e segue o padrão MIT ...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução abrangente O PlayHT é uma plataforma on-line eficiente que se concentra na geração de fala com IA, ajudando os usuários a converter rapidamente texto em fala natural e realista. Ela oferece mais de 600 vozes de IA, suporta mais de 60 idiomas e diversos sotaques e é adequada para uma ampla gama de cenários, como produção de podcast, conteúdo educacional, marketing e promoção. Use...
Introdução abrangente O MLX-Audio é uma ferramenta de código aberto desenvolvida com base na estrutura MLX da Apple, com foco na funcionalidade de conversão de texto em fala (TTS) e de fala em fala (STS). Ele aproveita ao máximo os poderosos recursos de computação do Apple Silicon (por exemplo, chips da série M) para fornecer soluções eficientes e rápidas de síntese de fala...
Introdução abrangente O Spark-TTS é uma ferramenta de conversão de texto em fala (TTS) de código aberto desenvolvida pela equipe do SparkAudio, hospedada no GitHub, projetada para ajudar os usuários a converter texto em fala natural e suave com eficiência. Ela se baseia em tecnologia avançada de aprendizagem profunda e oferece suporte a vários idiomas e voz...
Introdução abrangente O "Cat & Star" (maoyuxing.com) é uma plataforma interativa de criação de histórias projetada para crianças, que ajuda pais e filhos a criarem juntos contos de fadas personalizados por meio de aplicativos móveis. Os usuários podem inserir o nome, as preferências e outras informações de seus filhos para gerar um conteúdo de história exclusivo, permitindo que a criança se torne a história...
Introdução abrangente O TTS Importer é um projeto de código aberto desenvolvido para importar facilmente o serviço de síntese de fala TTS (Text-to-Speech) do Azure para vários softwares de leitura. A ferramenta é compatível com vários softwares de leitura populares, incluindo o Read (legado), o Love Reader, o Source Reader e outros. Com o TTS Importer,...
Introdução geral O NVIDIA AI Blueprint: PDF to Podcast é um projeto de código aberto desenvolvido pela NVIDIA para converter documentos PDF em conteúdo de áudio envolvente. O projeto utiliza a tecnologia NVIDIA NIM (NVIDIA Inference Microservices) para permitir a operação segura em redes privadas...
Introdução geral O Kokoro WebGPU é a versão WebGPU do modelo de conversão de texto em fala (TTS) do Kokoro, fornecido pela WebML Community na plataforma Hugging Face. O projeto utiliza a tecnologia WebGPU para permitir que os usuários executem conversões eficientes de texto para fala localmente em seus navegadores.
Descrição geral O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar uma fala realista e semelhante à humana e transcrever áudio em texto.
Introdução geral O Weights é uma plataforma social para criatividade usando IA que permite aos usuários criar capas de voz, conversão de texto em fala, imagens, músicas e vídeos com ações simples. A plataforma oferece uma grande variedade de ferramentas e modelos para ajudar os usuários a começar a criar rapidamente e compartilhar seu trabalho com a comunidade....
Introdução geral O AnyVoice é uma plataforma avançada de geração de fala com IA que oferece serviços de geração de fala e clonagem de voz ultrarrealistas. A plataforma permite que os usuários convertam texto em fala natural e escolham entre centenas de vozes predefinidas. Se você não conseguir encontrar a voz certa, basta gravar 3 segundos...
Introdução geral O Open NotebookLM é um projeto de código aberto desenvolvido para converter qualquer documento PDF em um podcast. A ferramenta usa modelos de código aberto Large Language Model (LLM) e Text-to-Speech (TTS) para processar o conteúdo do PDF, gerar diálogos naturais adequados para podcasts de áudio e gerar arquivos MP3. O projeto conta com o apoio da N...
Introdução geral O Llasa-3B é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong (HKUST Audio). O modelo é baseado na arquitetura Llama 3.2B, que foi cuidadosamente ajustada para fornecer geração de fala de alta qualidade que não só suporta vários idiomas, mas também permite a expressão emocional e a personalidade...
Introdução geral O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido por thewh1teagle, o projeto tem como objetivo fornecer soluções eficientes e rápidas de síntese de fala. O Kokoro-ONNX é compatível com vários idiomas, inclusive inglês, e planeja oferecer suporte a francês, japonês, coreano...
Introdução geral O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem uma saída de fala de alta qualidade.
Introdução geral O Jellypod é um poderoso estúdio de podcast de IA projetado para ajudar os usuários a criar, editar e publicar facilmente podcasts de IA de alta qualidade. Com o Jellypod, os usuários podem criar hosts de podcast personalizados, refinar scripts e publicar podcasts no Spotify, YouTube, Apple P...
Introdução geral O sherpa-onnx é um projeto de código aberto desenvolvido pela equipe do Next-gen Kaldi para fornecer soluções eficientes de reconhecimento e síntese de fala off-line. Ele é compatível com uma variedade de plataformas, incluindo Android, iOS, Raspberry Pi etc., e pode ser usado na ausência de conectividade de rede em tempo real...
Introdução geral O Audiblez é um projeto de código aberto desenvolvido para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e vozes. Os usuários podem converter eBooks com uma simples linha de comando ...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.