A Acoust é uma plataforma on-line de geração de voz com IA e de serviços de conversão de texto em fala (TTS) que usa a mais recente tecnologia de IA para gerar fala realista. A plataforma também oferece ferramentas avançadas de edição de vídeo que permitem aos usuários criar vídeos sem a necessidade de usar vários softwares.
Introdução abrangente O Kokoro-FastAPI é um pacote FastAPI baseado no Docker projetado para oferecer suporte ao modelo de conversão de texto em fala Kokoro-82M. O projeto é compatível com a aceleração da GPU NVIDIA e fornece processamento de filas e emenda automática para tornar a saída de fala do texto adulto bruto mais eficiente e coerente. O projeto ...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução geral O Kokoro 82M é um modelo eficiente de síntese de fala fornecido pela Hugging Face, projetado para gerar fala de alta qualidade com menos parâmetros e dados. O modelo tem 82 milhões de parâmetros, é distribuído sob a licença Apache 2.0, suporta uma ampla variedade de pacotes de voz (Voicepacks) e pode gerar...
Introdução geral O ebook2audiobook é uma poderosa ferramenta de código aberto de ebook para audiolivro. Ela é capaz de converter vários formatos de livros eletrônicos em audiolivros com marcadores de capítulos e metadados completos. A ferramenta usa o Calibre para a conversão de formato de e-book, usando o XTTSv2 da Coqui e o Fairseq...
Introdução geral O Edge TTS Worker (depende do edge-tts) é um serviço de proxy implantado no Cloudflare Worker que encapsula o serviço Microsoft Edge TTS em uma interface de API compatível com o formato OpenAI. Com esse projeto, os usuários podem usar facilmente sem a certificação da Microsoft...
Introdução abrangente A ViiTor AI é uma poderosa plataforma de inteligência artificial focada em fornecer serviços de tradução de vídeo de alta qualidade, clonagem de voz, vídeos de avatar gerados por IA e síntese de fala. A plataforma é compatível com vários idiomas e foi projetada para ajudar os usuários a criar conteúdo multilíngue com facilidade.
Introdução abrangente A Wondercraft é uma plataforma revolucionária de criação de áudio/vídeo orientada por IA que oferece aos criadores de conteúdo uma solução completa de produção de áudio/vídeo. A plataforma usa tecnologia avançada de IA para converter conteúdo de texto em fala natural e suave, suporta mais de 20 idiomas e oferece mais de 200 recursos de IA...
Introdução geral O NotebookLM Podcast é uma plataforma inovadora que utiliza tecnologia de inteligência artificial para transformar qualquer conteúdo textual em podcasts de áudio dinâmicos e envolventes. Seja você um estudante, educador, criador de conteúdo ou profissional ocupado, o NotebookLM Podcast oferece uma experiência personalizada...
Introdução geral O AivisSpeech é um software de síntese de fala japonesa baseado na interface de usuário do editor VOICEVOX. Ele integra o AivisSpeech Engine, que facilita a geração de discursos emocionalmente ricos. O AivisSpeech oferece suporte a uma ampla variedade de modelos de síntese de som, permitindo que os usuários gerem...
Introdução geral A PlayAI é uma plataforma de IA voltada para a geração e a clonagem de fala. Ela oferece uma ampla gama de modelos de fala capazes de gerar diálogos suaves e emocionais. Os usuários podem usar a plataforma para criar agentes de voz personalizados para aprimorar a experiência interativa. A tecnologia da PlayAI é adequada para uma ampla gama de aplicações...
Introdução geral O GizAI é uma plataforma completa com recursos integrados de geração de IA, anotações e armazenamento em nuvem. Os usuários podem gerar imagens, vídeos, áudios, textos, personagens, histórias e jogos com o GizAI e podem fazer anotações colaborativas e armazenamento em nuvem na plataforma.
Introdução abrangente OuteTTS é um modelo experimental de conversão de texto em fala (TTS) que usa uma abordagem de modelagem de linguagem pura para gerar fala de alta qualidade. Ao contrário dos sistemas TTS tradicionais, o OuteTTS não requer adaptadores externos ou arquiteturas complexas. O modelo é baseado na arquitetura LLaMa e oferece suporte a um recurso de clonagem de fala que pode gerar...
Introdução geral O PodLM é uma plataforma de geração de podcast de IA de última geração, projetada para ajudar os usuários a converter rapidamente texto, documentos ou conteúdo de URL em áudio de podcast de alta qualidade. Utilizando tecnologia de IA de ponta, o PodLM é capaz de gerar automaticamente scripts de podcast estruturados e envolventes e convertê-los em áudio de qualidade profissional...
Descrição geral O SoniTranslate é uma ferramenta de dublagem multilíngue de vídeo avançada e fácil de usar, projetada para fornecer uma solução de tradução de vídeo e áudio sincronizado. Ele usa tecnologias avançadas de reconhecimento de fala e tradução automática para traduzir o conteúdo do vídeo em vários idiomas e manter o áudio sincronizado. O projeto é baseado no Gradi...
Introdução abrangente O Tease Dubbing é um software popular de dublagem de IA com mais de 5 milhões de usuários. O software usa tecnologia avançada de dublagem inteligente de IA para oferecer efeitos de dublagem profissionais e realistas, o que é adequado para vídeos curtos, produção de anúncios, educação e treinamento e outros cenários. O Teaser Dubbing tem o compromisso de fornecer aos usuários efeitos rápidos e convenientes...
Introdução geral O YouTube Dubbing é uma plataforma de dublagem inteligente projetada para fornecer serviços de dublagem multilíngue para criadores e espectadores de vídeos. Por meio da tecnologia de IA, a plataforma é capaz de traduzir e gerar automaticamente dublagens de vídeos do YouTube, com suporte a vários idiomas e estilos de voz. Os usuários podem simplesmente instalar o plug-in e assistir ao vídeo...
Introdução geral O Podcastfy é um pacote Python de código aberto que usa a tecnologia GenAI (Generative Artificial Intelligence, Inteligência Artificial Generativa) para converter conteúdo da Web, arquivos PDF, texto, imagens, vídeos do YouTube e muitas outras fontes em diálogos de áudio multilíngues envolventes. Diferentemente da interface de usuário tradicional...
Introdução abrangente O QuickPiperAudiobook é um projeto de código aberto criado para converter vários formatos de texto (por exemplo, epub, mobi, txt, PDF, HTML etc.) em audiolivros com som natural com um simples comando. A ferramenta usa o modelo Piper para conversão e gerencia a instalação do Piper e do ph...
Introdução geral O PDF2Audio é um projeto de código aberto criado para converter arquivos PDF em conteúdo de áudio, como podcasts, palestras e resumos. A ferramenta utiliza o modelo GPT da OpenAI para geração de texto e conversão de texto em fala, permitindo que os usuários carreguem vários arquivos PDF, selecionem diferentes modelos de instrução (por exemplo, podcast...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.