Conversão de texto em fala com IA

Total de 79 artigos
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS: treinamento e síntese de fala em podcasts personalizados

O Synthesis Muyan-TTS é um modelo de conversão de texto em fala (TTS) de código aberto projetado para cenários de podcasting. Ele é pré-treinado com mais de 100.000 horas de dados de áudio de podcast e suporta síntese de fala de amostra zero para gerar fala natural de alta qualidade. O modelo é baseado no Llama-3.2-3...
3 meses atrás
01.4K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: processamento de áudio de código aberto e modelo de base de diálogo

Introdução geral O Kimi-Audio é um modelo de base de áudio de código aberto desenvolvido pela Moonshot AI, com foco na compreensão, geração e diálogo de áudio. Ele oferece suporte a uma ampla gama de tarefas de processamento de áudio, como reconhecimento de fala, P&R de áudio e reconhecimento de emoção de fala. O modelo foi testado em mais de 130...
3 meses atrás
01.2K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: transformando artigos populares de tecnologia em podcasts de áudio prontos para serem ouvidos

Introdução geral O Audibit é um projeto de código aberto, cuja função principal é transformar automaticamente os artigos do Hacker News, TechCrunch e outros artigos populares sobre tecnologia em podcasts de áudio, para que os usuários possam ouvir informações pela Web ou por dispositivos móveis durante o trajeto para o trabalho, o exercício físico ou quando estiverem ocupados. O projeto faz ...
3 meses atrás
01.1K
Dia:生成超现实多人对话的文本转语音模型

Dia: um modelo de conversão de texto em fala para gerar diálogos hiper-realistas para vários jogadores

Introdução geral O Dia é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pela Nari Labs, voltado para a geração de áudio de diálogo hiper-realista. Ele transforma scripts de texto em diálogos realistas com vários caracteres em um único processo, oferece suporte ao controle de emoções e entonação e até mesmo gera representações não verbais...
4 meses atrás
01K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS: uma ferramenta de conversão de texto em fala para gerar fala natural em chinês

Introdução geral O Orpheus-TTS é um sistema de conversão de texto em fala (TTS) de código aberto desenvolvido na arquitetura Llama-3b com o objetivo de gerar áudio próximo à fala humana natural. Ele foi lançado pela equipe da Canopy AI e é compatível com inglês, espanhol, francês...
4 meses atrás
01.7K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice: uma interface gráfica de conversão de texto em fala baseada em APIs de fluxo baseadas em silício

Introdução geral O Text2Voice é uma ferramenta de código aberto que fornece funcionalidade de conversão de texto em fala com base em uma API de mobilidade baseada em silício, com uma interface gráfica do usuário (GUI) limpa como seu melhor recurso. Ela foi criada pelo desenvolvedor Sheldon Lee no GitHub para permitir...
4 meses atrás
01.1K
集成多种先进语音合成服务的开源运营项目

Projeto operacional de código aberto que integra vários serviços avançados de síntese de fala

Introdução geral O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas e pode converter texto em fala natural, além de clonar vozes personalizadas por meio do upload de áudio. O projeto integra o Ope...
4 meses atrás
01.4K
Paper to Podcast:把学术论文转换为多人对话播客

Paper to Podcast: conversão de artigos acadêmicos em podcasts de conversas com várias pessoas

Introdução geral O Paper to Podcast é uma ferramenta de código aberto especializada na transformação de artigos de pesquisa acadêmica em podcasts animados e divertidos. Ela usa tecnologia de inteligência artificial para transformar um artigo em formato PDF em um diálogo entre três personagens - o anfitrião, o aluno e o especialista - para tornar a pesquisa complexa...
4 meses atrás
01K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: um modelo leve para sintetizar a fala em chinês e inglês

Introdução abrangente O MegaTTS3 é uma ferramenta de síntese de fala de código aberto desenvolvida pela ByteDance em cooperação com a Universidade de Zhejiang, com foco na geração de fala em chinês e inglês de alta qualidade. Seu modelo principal tem apenas 0,45B de parâmetros, é leve e eficiente, suporta a geração de discursos mistos em chinês e inglês e a clonagem de discursos. O projeto está hospedado em ...
4 meses atrás
01.3K
Podcastle:快速创建高质量播客的AI工具

Podcastle: a ferramenta de IA para criar rapidamente podcasts de alta qualidade

Introdução geral O Podcastle é uma plataforma on-line baseada em IA, especializada em ajudar os usuários a criar e editar rapidamente podcasts de alta qualidade. Ela integra recursos de gravação, edição e publicação, e os usuários podem fazer tudo isso por meio de um navegador, sem a necessidade de equipamentos especializados ou softwares complexos. A plataforma utiliza ...
4 meses atrás
01.1K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks: converter ebooks epub em audiolivros m4b

Introdução geral O Autiobooks é uma ferramenta de código aberto criada para ajudar os usuários a converter rapidamente livros eletrônicos no formato .epub em audiolivros no formato .m4b. Ela usa tecnologia de síntese de fala de alta qualidade fornecida pela Kokoro para gerar áudio natural e suave. Essa ferramenta foi desenvolvida por...
5 meses atrás
01.3K
PlayHT:生成超真实语音的AI工具

PlayHT: uma ferramenta de IA para gerar fala hiper-realista

Introdução geral A PlayHT é uma plataforma on-line eficiente que se concentra na geração de fala com IA para ajudar os usuários a converter rapidamente texto em fala natural e realista. Ela oferece mais de 600 vozes de IA que suportam mais de 60 idiomas e diversos sotaques para a produção de podcasts, conteúdo educacional, promoção de marketing...
5 meses atrás
01.2K
猫与星:和孩子一起编写专属童话故事的听故事APP

Cat & Star: um aplicativo de audição de histórias para escrever contos de fadas exclusivos com seu filho

Introdução geral O "Cat & Star" (maoyuxing.com) é uma plataforma interativa de criação de histórias projetada para crianças, que ajuda pais e filhos a criarem juntos contos de fadas personalizados por meio de aplicativos móveis. Os usuários podem inserir informações como o nome e as preferências da criança para gerar um conteúdo de história exclusivo...
6 meses atrás
01.4K
Azure TTS Importer:将语音合成服务集成到阅读软件中

Azure TTS Importer: Integrando serviços de síntese de fala ao software de leitura

Introdução geral O TTS Importer é um projeto de código aberto desenvolvido para importar facilmente os serviços de síntese de fala do Azure TTS (Text-to-Speech) para uma variedade de softwares de leitura. A ferramenta é compatível com vários softwares de leitura populares, incluindo o Read (legado...
6 meses atrás
01.4K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: uma API unificada para integrar a geração de fala, a transcrição de fala e a modelagem de voz do Well-Known

Introdução geral O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar...
6 meses atrás
01.9K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Weights: uma plataforma de autoria de música cover de imitação de voz e texto para fala

Introdução geral O Weights é uma plataforma social para criatividade usando IA que permite aos usuários criar capas de voz, conversão de texto em fala, imagens, músicas e vídeos com ações simples. A plataforma oferece uma grande variedade de ferramentas e modelos para ajudar os usuários a começar a criar rapidamente e compartilhar com a comunidade desde...
6 meses atrás
02.3K
AnyVoice:在线免费克隆声音,只要3秒实现语音克隆

AnyVoice: clonagem de voz on-line gratuita em apenas 3 segundos!

Introdução geral O AnyVoice é uma plataforma avançada de geração de fala com IA que oferece serviços de geração de fala e clonagem de voz ultrarrealistas. A plataforma permite que os usuários convertam texto em fala natural e escolham entre centenas de vozes predefinidas. Se você não conseguir encontrar a voz certa, basta...
6 meses atrás
02K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: converte PDF em podcasts de ferramentas de código aberto

Introdução geral O Open NotebookLM é um projeto de código aberto desenvolvido para converter qualquer documento PDF em um podcast. A ferramenta usa modelos de código aberto Large Language Model (LLM) e Text-to-Speech (TTS) para processar o conteúdo do PDF e gerar um diálogo natural adequado para podcasts de áudio...
6 meses atrás
01.7K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: um modelo de conversão de texto em fala de código aberto para geração e clonagem de fala de alta qualidade

Introdução geral O Llasa-3B é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong (HKUST Audio). O modelo se baseia na arquitetura Llama 3.2B, que foi cuidadosamente ajustada para oferecer geração de fala de alta qualidade que não só oferece suporte a várias...
6 meses atrás
01.8K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes

Introdução abrangente O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido pelo thewh1teagle, o projeto tem como objetivo fornecer soluções eficientes e rápidas de síntese de fala.
7 meses atrás
01.9K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Introdução geral O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem...
7 meses atrás
02.2K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Introdução geral O Audiblez é um projeto de código aberto criado para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e várias vozes. Os usuários podem simplesmente...
7 meses atrás
02K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust: plataformas de serviços de geração de fala com IA on-line e de conversão de texto em fala (TTS)

Introdução geral O Acoust é uma plataforma de serviços de geração de fala com IA on-line e de conversão de texto em fala (TTS) que usa a mais recente tecnologia de IA para gerar uma fala realista. A plataforma também oferece ferramentas avançadas de edição de vídeo que permitem aos usuários concluir a produção de vídeo sem a necessidade de vários softwares.
7 meses atrás
01.6K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: converta ebooks em audiolivros, ferramenta de código aberto com suporte multilíngue e clonagem de voz

Introdução geral O ebook2audiobook é uma poderosa ferramenta de código aberto de ebook para audiolivro. Ela é capaz de converter livros eletrônicos em vários formatos em audiolivros com marcadores de capítulos e metadados completos. A ferramenta usa o Calibre para a conversão do formato do livro eletrônico usando o Co...
7 meses atrás
02.4K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

Edge TTS Worker: implantação de APIs de síntese de fala da Microsoft usando Cloudflare, formato compatível com OpenAI e interface da Web empacotada

Introdução geral O Edge TTS Worker (que depende do edge-tts) é um serviço de proxy implantado no Cloudflare Worker que encapsula o serviço Microsoft Edge TTS em um formato compatível com o OpenAI ...
7 meses atrás
02.3K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI: serviço de tradução multilíngue de áudio/vídeo, síntese e clonagem de fala

Introdução abrangente A ViiTor AI é uma poderosa plataforma de inteligência artificial focada em fornecer serviços de tradução de vídeo de alta qualidade, clonagem de voz, vídeos de avatar gerados por IA e síntese de fala. A plataforma é compatível com vários idiomas e tem como objetivo ajudar os usuários a criar conteúdo multilíngue com facilidade.ViiTo...
8 meses atrás
02.7K
Wondercraft:专注广告配音、多人有声读物和播客的文本转音频工具

Wondercraft: ferramenta de texto para áudio com foco em dublagens de anúncios, audiolivros para vários jogadores e podcasts

Introdução geral A Wondercraft é uma plataforma revolucionária de criação de áudio e vídeo orientada por IA que oferece aos criadores de conteúdo uma solução completa para a produção de áudio e vídeo. Usando tecnologia avançada de IA, a plataforma é capaz de converter conteúdo de texto em fala natural e suave, com suporte para mais de 20 idiomas...
8 meses atrás
01.8K
GizAI:全能AI助手,集成主流生成式AI工具,让每个人免费使用商业化AI工具

GizAI: assistente de IA tudo em um, integrando as principais ferramentas de IA generativa e disponibilizando ferramentas de IA comerciais gratuitamente para todos

Introdução geral O GizAI é uma plataforma completa com recursos integrados de geração de IA, tomada de notas e armazenamento em nuvem. Os usuários podem gerar imagens, vídeos, áudios, textos, personagens, histórias e jogos com a GizAI e podem fazer anotações colaborativas e armazenamento em nuvem na plataforma.
8 meses atrás
03K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: modelo experimental de conversão de texto em fala, TTS implementado usando uma abordagem de modelagem de linguagem pura

Introdução abrangente OuteTTS é um modelo experimental de conversão de texto em fala (TTS) que usa uma abordagem de modelagem de linguagem pura para gerar fala de alta qualidade. Ao contrário dos sistemas TTS tradicionais, o OuteTTS não requer adaptadores externos ou arquiteturas complexas. O modelo é baseado na arquitetura LLaMa...
6 meses atrás
01.9K
PodLM:将对话、网页或长文本生成多语言音频播客(付费)

PodLM: gera podcasts de áudio multilíngues de diálogos, páginas da Web ou textos longos (pago)

Introdução geral O PodLM é uma plataforma de geração de podcast de IA de última geração, projetada para ajudar os usuários a converter rapidamente texto, documento ou conteúdo de URL em áudio de podcast de alta qualidade. Aproveitando a tecnologia de IA de ponta, o PodLM é capaz de gerar automaticamente scripts de podcast estruturados e envolventes e...
10 meses atrás
02.1K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

SoniTranslate: solução de dublagem de tradução de vídeo de código aberto, dublagem múltipla, ajuste de velocidade e imitação do som original

Descrição geral O SoniTranslate é uma ferramenta de dublagem multilíngue de vídeo avançada e fácil de usar, projetada para fornecer uma solução de tradução de vídeo e áudio sincronizado. Ele usa tecnologias avançadas de reconhecimento de fala e tradução automática para traduzir o conteúdo do vídeo em vários idiomas e manter o áudio sincronizado. O ...
10 meses atrás
03.9K
逗哥配音:专注短视频解说、创作的智能配音神器

Teaser Dubbing: ferramenta de dublagem inteligente com foco na criação e narração de vídeos curtos

Introdução abrangente O Tease Dubbing é um software popular de dublagem de IA com mais de 5 milhões de usuários. O software usa tecnologia avançada de dublagem inteligente de IA para oferecer efeitos de dublagem profissionais e realistas, o que é adequado para vídeos curtos, produção de anúncios, educação e treinamento e outros cenários. O Teaser Dubbing tem o compromisso de fornecer aos usuários uma...
10 meses atrás
01.8K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音

Dublagem do YouTube: traduza vídeos do YouTube para diferentes idiomas e sincronize a dublagem em tempo real

Introdução geral O YouTube Dubbing é uma plataforma de dublagem inteligente projetada para fornecer serviços de dublagem multilíngue para criadores e espectadores de vídeos. Por meio da tecnologia de IA, a plataforma é capaz de traduzir e gerar automaticamente dublagens de vídeos do YouTube, com suporte a vários idiomas e estilos de voz. Os usuários só precisam instalar...
10 meses atrás
02K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy: conteúdo de várias fontes para ferramenta de conversação de áudio multilíngue, uma alternativa de código aberto aos recursos de podcasting do NotebookLM

Introdução geral O Podcastfy é um pacote Python de código aberto que usa a tecnologia GenAI (Generative Artificial Intelligence, Inteligência Artificial Generativa) para converter conteúdo da Web, arquivos PDF, texto, imagens, vídeos do YouTube e muitas outras fontes em...
10 meses atrás
01.8K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: uma chave para gerar audiolivros com qualidade de som natural, suporte para PDF, epub, docx e outros formatos

Introdução abrangente O QuickPiperAudiobook é um projeto de código aberto desenvolvido para converter vários formatos de texto (por exemplo, epub, mobi, txt, PDF, HTML etc.) em audiolivros com som natural por meio de um simples comando. A ferramenta usa o Pi...
10 meses atrás
01.6K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI: plataforma inteligente de síntese de fala e clonagem de voz

Introdução abrangente O Seaweed AI é um produto de dublagem inteligente que pode converter texto em voz on-line, com base na plataforma aberta Yun Zhisheng AI. Os usuários podem se autoajudar para obter clonagem de voz e fornecer pronunciadores de IA de diferentes gêneros, sotaques e idiomas, e dublar diretamente a voz após a inserção do texto. Ele pode dublar rapidamente...
10 meses atrás
02K
edge-tts:文本转语音Python模块|免费文本转语音服务

edge-tts: módulo Python de conversão de texto em fala | Serviço gratuito de conversão de texto em fala

Descrição geral edge-tts é um módulo Python de código aberto que permite que os usuários usem o serviço de conversão de texto em fala on-line do Microsoft Edge no código Python sem a necessidade do navegador Microsoft Edge, do sistema operacional Windows ou do segredo da API...
10 meses atrás
02.5K
Descript:一站式视频与播客编辑,简单如编辑文档

Descrição: Edição completa de vídeos e podcasts, tão simples quanto editar um documento

Descript Descrição geral O Descript é uma ferramenta de edição de vídeo e podcast avançada e fácil de usar. Possui precisão e velocidade de transcrição líderes do setor e ferramentas de correção avançadas, bem como a capacidade de transcrever vídeo para texto com tecnologia de IA e editar vídeo editando o texto. Além de...
10 meses atrás
02.1K
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器

Murf AI: Modificador de voz|Fala para texto|Texto para fala|Editor de áudio

Introdução geral O Murf AI é uma poderosa ferramenta on-line de geração de voz de inteligência artificial que converte texto em fala humana quase real. Ela oferece até 120+ opções de voz de IA, suporta mais de 20 idiomas e é adequada para uma variedade de situações, como podcasts, vídeos, apresentações profissionais etc.
10 meses atrás
02.3K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI: Plataforma de síntese de fala de inteligência artificial | Clonagem de voz | Detecção profunda de áudio falso

Introdução geral O Resemble AI é uma plataforma de síntese de voz com inteligência artificial projetada para empresas. A plataforma oferece tecnologia de ponta de geração de voz de IA e detecção de áudio falsificado profundo para a segurança futura das informações. Os recursos incluem clonagem de voz, detecção de áudio falso profundo em tempo real, tecnologia de marca d'água de IA...
10 meses atrás
02K
Ondoku:在线文本朗读工具|文本转语音|图片转语音朗读

Ondoku: Leitor de texto on-line|Texto para fala|Leitor de imagem para fala

Ondoku Introdução geral O Ondoku é um software on-line de conversão de texto em fala que permite que os usuários insiram conteúdo de texto na caixa de texto fornecida pelo site, e o software é capaz de converter o artigo em uma leitura de voz de acordo com as necessidades do usuário, além de permitir salvar a voz como um arquivo no formato MP3. Esse serviço é adequado tanto para ouvir instantaneamente...
10 meses atrás
02.1K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: Ferramenta profissional de edição de áudio on-line|Produção de audiolivros|Texto para fala|Separação de acompanhamento

Introdução geral O XAudioPro é uma ferramenta avançada de edição e transcodificação de áudio on-line em tempo real que é profissional e portátil. Ele oferece suporte a funções profissionais de edição de áudio, como corte, recorte, cópia, exclusão, restauração e controle de ganho de amplitude. Também oferece serviços de remoção de ruído, como redução de ruído por subtração espectral,...
10 meses atrás
01.7K
Hume AI:赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: Capacitando a IA com reconhecimento de emoções | Reconhecimento de estados emocionais a partir de sons e expressões | Geração de fala com estados emocionais

Introdução geral A Hume AI é uma empresa de IA focada em inteligência emocional, desenvolvendo tecnologias de IA multimodais que entendem e respondem às emoções humanas. Seu principal produto, a Empathic Voice Interface (EVI), é capaz de reconhecer e responder às emoções do usuário...
10 meses atrás
01.7K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop: plataforma de criação de locução profissional e narração de vídeos curtos | locução de pessoa real | voz clone | um clique em um filme

Introdução abrangente O Magic Voice Workshop é uma plataforma completa de dublagem de vídeos curtos e de IA com informações sobre dublagem de software, dublagem real, bibliotecas de sons, serviços de clonagem e muito mais. A plataforma integra edição de áudio, geração de cópias de IA, edição de vídeo e ferramentas de colaboração para serviços relacionados a áudio e criação de conteúdo. Os usuários experimentam o editor de áudio...
10 meses atrás
01.6K
EmotiVoice(易魔声):多声音与情感提示控制的文本转语音引擎

EmotiVoice: mecanismo de conversão de texto em fala com controles de várias vozes e sugestões emocionais

Introdução abrangente O EmotiVoice é um mecanismo de conversão de texto em fala (TTS) com várias vozes e controle de dicas emocionais desenvolvido pela NetEaseYoudao. Esse mecanismo TTS de código aberto é compatível com inglês e chinês, tem mais de 2.000 vozes diferentes e capacidade de síntese de emoções para criar vozes com...
5 meses atrás
02.2K
Listnr:多语言AI语音生成器,变革性人声合成技术

Listnr: gerador de fala com IA multilíngue, tecnologia transformadora de síntese de voz humana

Introdução geral O Listnr é um software de conversão de texto em fala com um mecanismo de IA generativo que cria síntese de fala em mais de 1.000 vozes diferentes em mais de 142 idiomas, incluindo a clonagem de sua própria voz. A plataforma atende a mais de 1 milhão de usuários em vídeos curtos, YouTub...
10 meses atrás
01.5K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: música rap gerada por IA e plataforma de clonagem de voz | Text to Speech

Introdução geral O Uberduck AI é uma plataforma inovadora que fornece síntese de IA de vozes cantadas e faladas para agências criativas, produtores musicais e programadores. Os usuários podem escolher diferentes ritmos musicais, gerar letras usando IA ou escrever suas próprias letras, selecionar sons específicos e, por fim, criar músicas de rap...
11 meses atrás
02K
NotebookLM:知识笔记检索阅读,多类文档生成语音对话播客

NotebookLM: Leitura de recuperação de notas de conhecimento, geração de documentos multiclasse Podcasts de diálogo por voz

Introdução geral O NotebookLM é uma ferramenta de colaboração com IA personalizada do Google, projetada para ajudar os usuários a usar suas mentes em todo o seu potencial. Os usuários podem fazer upload de documentos e o NotebookLM domina instantaneamente o conteúdo dessas fontes, facilitando a leitura para os usuários...
2 meses atrás
02.2K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: plataforma completa de processamento de áudio/vídeo|geração de vídeo|legenda de IA|extração de áudio|fala para texto

Introdução abrangente O Record Cafe é uma plataforma completa de processamento de áudio/vídeo que oferece serviços de diálogo em vídeo com IA, legendas com IA e fala com IA para texto. As funções incluem gravação de tela, edição de vídeo, conversão de GIF/áudio, etc., e suporta armazenamento e compartilhamento em nuvem. A interface é intuitiva e fácil de usar, além de oferecer suporte à gravação em várias telas e ao uso inteligente em vários idiomas...
8 meses atrás
02.2K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: ferramenta de conversão de texto em fala multilíngue rápida e controlável (com suporte para mais de 7.000 idiomas)

Introdução geral O IMS Toucan é um kit de ferramentas de conversão de texto em fala (TTS) de última geração desenvolvido pelo Instituto de Processamento de Linguagem Natural (IMS) da Universidade de Stuttgart, Alemanha. O kit de ferramentas é compatível com mais de 7.000 idiomas e é rápido, controlável e tem baixos requisitos de recursos computacionais.
6 meses atrás
01.9K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS: um modelo de geração de fala que imita a voz de uma pessoa real falando (pacote de aceleração de um clique do ChatTTS)

Introdução geral O ChatTTS é um modelo de fala generativo projetado para cenários de diálogo. Ele gera fala natural e expressiva, suporta vários idiomas e vários falantes e é adequado para diálogos interativos. O modelo faz isso prevendo e controlando recursos rítmicos refinados, como risos, pausas e interjeições, além de...
6 meses atrás
02K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS: Ferramenta on-line gratuita de conversão de texto em fala|Aumento de áudio|Clipes de áudio

FreeTTS Descrição geral O FreeTTS é uma ferramenta on-line gratuita de conversão de texto em fala que permite aos usuários converter texto em arquivos de voz com som natural. Com suporte a vários idiomas e opções de som, os usuários podem converter texto nos formatos MP3, WAV, OGG e ACC...
11 meses atrás
02.8K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

Introdução abrangente O Easy-Voice-Toolkit é um kit de ferramentas multifuncional baseado no Open Source Speech Project, que oferece uma ampla variedade de ferramentas de áudio automatizadas para reconhecimento de fala, transcrição de fala, conversão de fala, criação de conjuntos de dados e treinamento de modelos. Os usuários podem usar essas ferramentas de forma seletiva, conforme necessário...
11 meses atrás
02.1K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人

DupDub: editor de vídeo com inteligência artificial|dublagem|tradução de vídeo|digitalizador de fotos

Descrição geral O Dupdub é uma plataforma de criação de podcast e apresentação de vídeo que oferece uma variedade de ferramentas de IA para apoiar a criatividade dos usuários. Os recursos abrangem a criação de texto para vídeo, oferecendo serviços de dublagem de voz e vídeo com IA, bem como edição, transcrição e legendagem de vídeo. A Dupdub também é ...
12 meses atrás
01.8K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: Gere vídeos digitais de fala humana com apenas uma foto, várias ferramentas gratuitas de geração de vídeo

Descrição geral O Vidnoz é uma plataforma gratuita de geração de vídeos com IA para criar rapidamente vídeos com IA em menos de 1 minuto. Não é necessário nenhum custo, download ou experiência. A plataforma oferece mais de 500 avatares de IA, mais de 470 locuções realistas de IA e mais de 500 modelos. Com o vídeo de IA do Vidnoz...
12 meses atrás
02.4K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: cliente nativo para conversão de vídeo em legenda, convertendo legendas multilíngues

Descrição geral O MemoAI é uma poderosa ferramenta de tradução de vídeo projetada para converter arquivos de vídeo e áudio em texto, legendas e notas. Seja um vídeo do YouTube, um podcast ou um arquivo local, o MemoAI pode lidar com isso com facilidade. Ele suporta mais de 90 idiomas, como chinês, inglês, japonês...
8 meses atrás
02.5K
腾讯智影:智能视频创作工具|AI数字人、动漫生成套件

Tencent Smart Shadow: Ferramenta de criação de vídeo inteligente | AI Digital Man, Kit de geração de anime

Introdução abrangente O Tencent Smart Shadow é uma plataforma de criação de vídeo inteligente on-line lançada pela Tencent, que pode oferecer suporte à dublagem de texto, transmissão digital humana, reconhecimento automático de legendas e outras funções por meio de poderosas ferramentas de IA fornecidas por serviços em nuvem.
1 ano atrás
02.3K
音剪:喜马拉雅自然人声、多人旁白音频创作平台

Recorte de som: voz humana natural do Himalaya, plataforma de criação de áudio com vários narradores

Introdução abrangente O Himalaya Audio Editor é uma plataforma abrangente de criação de áudio com IA. Ele oferece recursos poderosos que dão suporte aos usuários com produção de podcast de nível profissional, gravação de várias faixas, edição de áudio e a capacidade de converter texto em fala. A plataforma também contém várias opções para voz profissional, ajudando os usuários...
1 ano atrás
02.3K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: geração de modelos de conversão de texto em fala específicos do locutor a partir do texto de entrada

Introdução geral O Parler-TTS é uma biblioteca de modelos de conversão de texto em fala (TTS) de código aberto desenvolvida pela Hugging Face, projetada para gerar fala de alta qualidade e com som natural. O modelo é capaz de gerar fala com base no texto de entrada com um estilo de locutor específico (por exemplo, gênero, tom, estilo de fala...).
6 meses atrás
01.6K