Aprendizagem pessoal com IA
e orientação prática
豆包Marscode1
Total de 65 artigos

Tags: ai texto para fala

Autiobooks:将epub电子书转换为m4b有声书-首席AI分享圈

Autiobooks: converter ebooks epub em audiolivros m4b

Introdução geral O Autiobooks é uma ferramenta de código aberto criada para ajudar os usuários a converter rapidamente livros eletrônicos no formato .epub em audiolivros no formato .m4b. Ela usa tecnologia de síntese de fala de alta qualidade fornecida pela Kokoro para gerar áudio natural e suave. A ferramenta foi desenvolvida por David Nesbitt e segue o padrão MIT ...

PlayHT:生成超真实语音的AI工具-首席AI分享圈

PlayHT: uma ferramenta de IA para gerar fala hiper-realista

Introdução abrangente O PlayHT é uma plataforma on-line eficiente que se concentra na geração de fala com IA, ajudando os usuários a converter rapidamente texto em fala natural e realista. Ela oferece mais de 600 vozes de IA, suporta mais de 60 idiomas e diversos sotaques e é adequada para uma ampla gama de cenários, como produção de podcast, conteúdo educacional, marketing e promoção. Use...

MLX-Audio: ferramenta de conversão de texto em fala baseada na estrutura MLX da Apple

Introdução abrangente O MLX-Audio é uma ferramenta de código aberto desenvolvida com base na estrutura MLX da Apple, com foco na funcionalidade de conversão de texto em fala (TTS) e de fala em fala (STS). Ele aproveita ao máximo os poderosos recursos de computação do Apple Silicon (por exemplo, chips da série M) para fornecer soluções eficientes e rápidas de síntese de fala...

Spark-TTS:生成自然语音的文本转语音工具-首席AI分享圈

Spark-TTS: uma ferramenta de conversão de texto em fala para gerar fala natural

Introdução abrangente O Spark-TTS é uma ferramenta de conversão de texto em fala (TTS) de código aberto desenvolvida pela equipe do SparkAudio, hospedada no GitHub, projetada para ajudar os usuários a converter texto em fala natural e suave com eficiência. Ela se baseia em tecnologia avançada de aprendizagem profunda e oferece suporte a vários idiomas e voz...

猫与星:和孩子一起编写专属童话故事的听故事APP-首席AI分享圈

Cat & Star: um aplicativo de audição de histórias para escrever contos de fadas exclusivos com seu filho

Introdução abrangente O "Cat & Star" (maoyuxing.com) é uma plataforma interativa de criação de histórias projetada para crianças, que ajuda pais e filhos a criarem juntos contos de fadas personalizados por meio de aplicativos móveis. Os usuários podem inserir o nome, as preferências e outras informações de seus filhos para gerar um conteúdo de história exclusivo, permitindo que a criança se torne a história...

Azure TTS Importer:将语音合成服务集成到阅读软件中-首席AI分享圈

Azure TTS Importer: Integrando serviços de síntese de fala ao software de leitura

Introdução abrangente O TTS Importer é um projeto de código aberto desenvolvido para importar facilmente o serviço de síntese de fala TTS (Text-to-Speech) do Azure para vários softwares de leitura. A ferramenta é compatível com vários softwares de leitura populares, incluindo o Read (legado), o Love Reader, o Source Reader e outros. Com o TTS Importer,...

NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具-首席AI分享圈

NVIDIA PDF to Podcast: Ferramenta de IA para converter PDF em podcast definindo palavras de aviso de orientação

Introdução geral O NVIDIA AI Blueprint: PDF to Podcast é um projeto de código aberto desenvolvido pela NVIDIA para converter documentos PDF em conteúdo de áudio envolvente. O projeto utiliza a tecnologia NVIDIA NIM (NVIDIA Inference Microservices) para permitir a operação segura em redes privadas...

Kokoro WebGPU:浏览器中离线运行的文本转语音服务-首席AI分享圈

Kokoro WebGPU: um serviço de conversão de texto em fala para operação off-line em navegadores

Introdução geral O Kokoro WebGPU é a versão WebGPU do modelo de conversão de texto em fala (TTS) do Kokoro, fornecido pela WebML Community na plataforma Hugging Face. O projeto utiliza a tecnologia WebGPU para permitir que os usuários executem conversões eficientes de texto para fala localmente em seus navegadores.

Orate:集成知名语音生成、语音转录与变声模型的统一API-首席AI分享圈

Orate: uma API unificada para integrar a geração de fala, a transcrição de fala e a modelagem de voz do Well-Known

Descrição geral O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar uma fala realista e semelhante à humana e transcrever áudio em texto.

Weights:模仿声音翻唱歌曲和文本转语音的创作平台-首席AI分享圈

Weights: uma plataforma de autoria de música cover de imitação de voz e texto para fala

Introdução geral O Weights é uma plataforma social para criatividade usando IA que permite aos usuários criar capas de voz, conversão de texto em fala, imagens, músicas e vídeos com ações simples. A plataforma oferece uma grande variedade de ferramentas e modelos para ajudar os usuários a começar a criar rapidamente e compartilhar seu trabalho com a comunidade....

AnyVoice:在线免费克隆声音,只要3秒实现语音克隆-首席AI分享圈

AnyVoice: clonagem de voz on-line gratuita em apenas 3 segundos!

Introdução geral O AnyVoice é uma plataforma avançada de geração de fala com IA que oferece serviços de geração de fala e clonagem de voz ultrarrealistas. A plataforma permite que os usuários convertam texto em fala natural e escolham entre centenas de vozes predefinidas. Se você não conseguir encontrar a voz certa, basta gravar 3 segundos...

Open NotebookLM:将PDF转换为播客的开源工具-首席AI分享圈

Open NotebookLM: converte PDF em podcasts de ferramentas de código aberto

Introdução geral O Open NotebookLM é um projeto de código aberto desenvolvido para converter qualquer documento PDF em um podcast. A ferramenta usa modelos de código aberto Large Language Model (LLM) e Text-to-Speech (TTS) para processar o conteúdo do PDF, gerar diálogos naturais adequados para podcasts de áudio e gerar arquivos MP3. O projeto conta com o apoio da N...

Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型-首席AI分享圈

Llasa 1~8B: um modelo de conversão de texto em fala de código aberto para geração e clonagem de fala de alta qualidade

Introdução geral O Llasa-3B é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong (HKUST Audio). O modelo é baseado na arquitetura Llama 3.2B, que foi cuidadosamente ajustada para fornecer geração de fala de alta qualidade que não só suporta vários idiomas, mas também permite a expressão emocional e a personalidade...

Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes

Introdução geral O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido por thewh1teagle, o projeto tem como objetivo fornecer soluções eficientes e rápidas de síntese de fala. O Kokoro-ONNX é compatível com vários idiomas, inclusive inglês, e planeja oferecer suporte a francês, japonês, coreano...

OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式-首席AI分享圈

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Introdução geral O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem uma saída de fala de alta qualidade.

Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成-首席AI分享圈

Sherpa-ONNX: reconhecimento e síntese de fala off-line com o ONNXRuntime

Introdução geral O sherpa-onnx é um projeto de código aberto desenvolvido pela equipe do Next-gen Kaldi para fornecer soluções eficientes de reconhecimento e síntese de fala off-line. Ele é compatível com uma variedade de plataformas, incluindo Android, iOS, Raspberry Pi etc., e pode ser usado na ausência de conectividade de rede em tempo real...

Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物-首席AI分享圈

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Introdução geral O Audiblez é um projeto de código aberto desenvolvido para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e vozes. Os usuários podem converter eBooks com uma simples linha de comando ...

pt_BRPortuguês do Brasil