Synthèse vocale AI

Total 79 articles
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS : formation et synthèse vocale personnalisée pour podcast

Synthesis Muyan-TTS est un modèle de synthèse vocale open source conçu pour les scénarios de podcasting. Il est pré-entraîné avec plus de 100 000 heures de données audio de podcasts et prend en charge la synthèse vocale sans échantillon pour générer une parole naturelle de haute qualité. Le modèle est basé sur Llama-3.2-3...
Il y a 3 mois
01.4K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio : traitement audio open source et modèle de base de dialogue

Introduction générale Kimi-Audio est un modèle de base audio open source développé par Moonshot AI, qui se concentre sur la compréhension, la génération et le dialogue audio. Il prend en charge un large éventail de tâches de traitement audio telles que la reconnaissance vocale, les questions-réponses audio et la reconnaissance des émotions vocales. Le modèle a été testé sur plus de 130...
Il y a 3 mois
01.2K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit : transformer des articles technologiques populaires en podcasts audio prêts à écouter

Introduction générale Audibit est un projet open source dont la fonction principale est de transformer automatiquement les articles de Hacker News, TechCrunch et d'autres articles technologiques populaires en podcasts audio, afin que les utilisateurs puissent écouter des informations sur le Web ou sur leur téléphone portable pendant leurs déplacements, leurs activités physiques ou lorsqu'ils sont occupés. Le projet permet de ...
Il y a 3 mois
01.1K
Dia:生成超现实多人对话的文本转语音模型

Dia : un modèle de synthèse vocale pour générer des dialogues multijoueurs hyperréalistes

Introduction générale Dia est un modèle de synthèse vocale open source développé par Nari Labs et destiné à générer des dialogues audio hyperréalistes. Il transforme les scripts textuels en dialogues réalistes à plusieurs personnages en un seul processus, prend en charge le contrôle des émotions et de l'intonation, et génère même des représentations non verbales...
Il y a 4 mois
01K
Vapi:帮助开发者快速构建低延时语音助手

Vapi : aider les développeurs à créer rapidement des assistants vocaux à faible latence

Introduction Vapi est une plateforme d'IA vocale pour les développeurs. Elle permet aux utilisateurs de créer, de tester et de déployer des assistants vocaux en quelques minutes, résolvant ainsi le problème du développement d'applications vocales traditionnelles, long et difficile à mettre à l'échelle.Vapi fournit des outils et une infrastructure complets pour prendre en charge les conversations en temps réel, les...
Il y a 4 mois
01.2K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice : une interface graphique de synthèse vocale basée sur des API de flux au silicium

Introduction générale Text2Voice est un outil open source qui fournit une fonctionnalité de synthèse vocale basée sur une API de mobilité au silicium, avec une interface utilisateur graphique (GUI) propre comme sa meilleure caractéristique. Il a été créé par le développeur Sheldon Lee sur GitHub pour permettre...
Il y a 4 mois
01.1K
集成多种先进语音合成服务的开源运营项目

Projet opérationnel open source qui intègre plusieurs services avancés de synthèse vocale

Introduction générale Open-VoiceCanvas est une plateforme de synthèse vocale open source développée par l'équipe ItusiAI. Elle prend en charge plus de 50 langues et permet de convertir du texte en parole naturelle, ainsi que de cloner des voix personnalisées en téléchargeant des fichiers audio. Le projet intègre Ope...
Il y a 4 mois
01.4K
Paper to Podcast:把学术论文转换为多人对话播客

Du papier au podcast : convertir des documents académiques en podcasts de conversation à plusieurs personnes

Introduction générale Paper to Podcast est un outil open source spécialisé dans la transformation de documents de recherche académique en podcasts vivants et divertissants. Il utilise une technologie d'intelligence artificielle pour transformer un document au format PDF en un dialogue entre trois personnages - l'hôte, l'apprenant et l'expert - afin de rendre...
Il y a 4 mois
01K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3 : un modèle léger pour la synthèse de la parole chinoise et anglaise

Introduction MegaTTS3 est un outil de synthèse vocale open source développé par ByteDance en coopération avec l'Université de Zhejiang, qui se concentre sur la génération de discours chinois et anglais de haute qualité. Son modèle de base est seulement 0,45B paramètres, léger et efficace, supportant la génération de discours chinois et anglais mixtes et le clonage de discours. Le projet est hébergé sur ...
Il y a 4 mois
01.3K
Podcastle:快速创建高质量播客的AI工具

Podcastle : un outil d'IA pour créer rapidement des podcasts de haute qualité

Introduction générale Podcastle est une plateforme en ligne basée sur l'IA, spécialisée dans la création et l'édition rapides de podcasts de haute qualité. Elle intègre des fonctions d'enregistrement, d'édition et de publication, et les utilisateurs peuvent tout faire à partir d'un navigateur sans avoir besoin d'équipement spécialisé ou de logiciel complexe. La plateforme utilise ...
Il y a 4 mois
01.1K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks : convertir des ebooks epub en audiobooks m4b

Introduction générale Autiobooks est un outil open source conçu pour aider les utilisateurs à convertir rapidement les livres électroniques au format .epub en livres audio au format .m4b. Il utilise la technologie de synthèse vocale de haute qualité fournie par Kokoro pour générer un son naturel et fluide. Cet outil est alimenté par...
il y a 5 mois
01.3K
PlayHT:生成超真实语音的AI工具

PlayHT : un outil d'IA pour générer des discours hyperréalistes

Introduction générale PlayHT est une plateforme en ligne efficace qui se concentre sur la génération de discours d'IA pour aider les utilisateurs à convertir rapidement un texte en un discours naturel et réaliste. Elle propose plus de 600 voix d'IA dans plus de 60 langues et divers accents pour la production de podcasts, de contenus éducatifs, de promotions marketing...
il y a 5 mois
01.2K
猫与星:和孩子一起编写专属童话故事的听故事APP

Cat & Star : Une application d'écoute d'histoires pour écrire des contes de fées exclusifs avec votre enfant

Introduction générale "Cat & Star" (maoyuxing.com) est une plateforme interactive de création d'histoires destinée aux enfants, qui aide les parents et les enfants à créer ensemble des contes de fées personnalisés par le biais d'applications mobiles. Les utilisateurs peuvent saisir des informations telles que le nom de l'enfant et ses préférences pour générer un contenu d'histoire unique...
Il y a 6 mois
01.4K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate : une API unifiée pour l'intégration de la génération de parole Well-Known, de la transcription de la parole et de la modélisation de la voix

Introduction générale Orate est une boîte à outils d'IA axée sur la génération et la transcription de la parole. Il fournit une API unifiée qui s'intègre de manière transparente avec les principaux fournisseurs d'IA tels que OpenAI, ElevenLabs et AssemblyAI afin d'aider les utilisateurs à créer des...
Il y a 6 mois
01.9K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Poids : une plateforme de création de chansons de reprises et de textes à voix haute pour l'imitation vocale

Introduction générale Weights est une plateforme sociale de créativité utilisant l'IA qui permet aux utilisateurs de créer des couvertures vocales, de la synthèse vocale, des images, de la musique et des vidéos avec des actions simples. La plateforme propose une multitude d'outils et de modèles pour aider les utilisateurs à commencer à créer rapidement et à partager avec la communauté depuis...
Il y a 6 mois
02.3K
AnyVoice:在线免费克隆声音,只要3秒实现语音克隆

AnyVoice : clonage vocal gratuit en ligne en seulement 3 secondes !

Introduction générale AnyVoice est une plateforme avancée de génération de discours par IA qui fournit des services de génération de discours et de clonage de voix ultra-réalistes. La plateforme permet aux utilisateurs de convertir du texte en parole naturelle et de choisir parmi des centaines de voix prédéfinies. Si vous ne trouvez pas la bonne voix, il vous suffit de...
Il y a 6 mois
02K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B : un modèle de synthèse vocale à source ouverte pour la génération et le clonage de la parole de haute qualité

Introduction générale Llasa-3B est un modèle de synthèse vocale open source développé par le laboratoire audio de l'université des sciences et technologies de Hong Kong (HKUST Audio). Le modèle est basé sur l'architecture Llama 3.2B, qui a été soigneusement réglée pour fournir une génération de parole de haute qualité qui prend non seulement en charge de multiples...
Il y a 6 mois
01.8K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez : générer des livres audio, convertir des livres électroniques en livres audio avec Kokoro

Introduction générale Audiblez est un projet open source conçu pour convertir les livres électroniques (format .epub) en livres audio (format .m4b). Le projet utilise la technologie de synthèse vocale de haute qualité de Kokoro pour prendre en charge plusieurs langues et plusieurs voix. Les utilisateurs peuvent simplement...
Il y a 7 mois
02K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust : Plateformes de services en ligne de génération de la parole par l'IA et de synthèse vocale (TTS)

Introduction générale Acoust est une plateforme de services en ligne de génération de discours par IA et de synthèse vocale qui utilise les dernières technologies d'IA pour générer des discours réalistes. La plateforme offre également de puissants outils d'édition vidéo qui permettent aux utilisateurs de réaliser des productions vidéo sans avoir recours à de multiples logiciels.
Il y a 7 mois
01.6K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook : convertir des livres électroniques en livres audio, outil open source avec support multilingue et clonage de voix

Introduction générale ebook2audiobook est un puissant outil open source de conversion de livres électroniques en livres audio. Il est capable de convertir des livres électroniques dans plusieurs formats en livres audio avec des marqueurs de chapitres et des métadonnées. L'outil utilise Calibre pour la conversion des formats de livres électroniques en utilisant Co...
Il y a 7 mois
02.4K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

Edge TTS Worker : Déploiement des API de synthèse vocale de Microsoft à l'aide de Cloudflare, d'un format compatible avec OpenAI et d'une interface Web packagée

Introduction générale Edge TTS Worker (qui s'appuie sur edge-tts) est un service proxy déployé sur Cloudflare Worker qui encapsule le service Microsoft Edge TTS dans un format compatible avec OpenAI ...
Il y a 7 mois
02.3K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI : Service de synthèse de traduction multilingue audio/vidéo et de clonage de la parole

Introduction ViiTor AI est une puissante plateforme d'intelligence artificielle qui fournit des services de traduction vidéo de haute qualité, de clonage de voix, de vidéos d'avatars générés par l'IA et de synthèse vocale. La plateforme prend en charge plusieurs langues et vise à aider les utilisateurs à créer facilement des contenus multilingues.ViiTo...
Il y a 8 mois
02.7K
Wondercraft:专注广告配音、多人有声读物和播客的文本转音频工具

Wondercraft : outil texte-audio axé sur les voix-off, les livres audio multijoueurs et les podcasts.

Introduction générale Wondercraft est une plateforme révolutionnaire de création audio et vidéo pilotée par l'IA qui offre aux créateurs de contenu une solution unique pour la production audio et vidéo. Grâce à une technologie d'IA avancée, la plateforme est capable de convertir le contenu textuel en une parole naturelle et fluide, prenant en charge plus de 20 langues...
Il y a 8 mois
01.8K
NotebookLM Podcast:任何文档生成多语言个性化AI播客(付费)

NotebookLM Podcast : Générer un podcast AI multilingue personnalisé à partir de n'importe quel document (payant)

Description générale NotebookLM Podcast est une plateforme innovante qui utilise la technologie de l'intelligence artificielle pour transformer n'importe quel contenu textuel en podcasts audio dynamiques et attrayants. Que vous soyez un étudiant, un éducateur, un créateur de contenu ou un professionnel occupé, NotebookLM...
Il y a 8 mois
01.7K
PlayAI:提供流畅、富有情感的语音对话和语音合成服务(英文)

PlayAI : fournir des services de dialogue vocal et de synthèse vocale fluides et émotionnels (anglais)

Introduction générale PlayAI est une plateforme d'IA axée sur la génération et le clonage de la parole. Elle offre une large gamme de modèles vocaux capables de générer des dialogues fluides et émotionnels. Les utilisateurs peuvent utiliser la plateforme pour créer des agents vocaux personnalisés afin d'améliorer l'expérience interactive....
Il y a 9 mois
01.5K
GizAI:全能AI助手,集成主流生成式AI工具,让每个人免费使用商业化AI工具

GizAI : assistant d'IA tout-en-un, intégrant les principaux outils d'IA générative et rendant les outils d'IA commerciaux libres d'utilisation pour tous.

Introduction générale GizAI est une plateforme unique avec des capacités intégrées de génération d'IA, de prise de notes et de stockage en nuage. Les utilisateurs peuvent générer des images, des vidéos, des audios, des textes, des personnages, des histoires et des jeux avec GizAI, et peuvent prendre des notes collaboratives et...
Il y a 8 mois
03K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS : modèle expérimental de synthèse vocale, TTS mis en œuvre à l'aide d'une approche de modélisation du langage pur

Introduction complète OuteTTS est un modèle expérimental de synthèse vocale qui utilise une approche de modélisation du langage pur pour générer une parole de haute qualité. Contrairement aux systèmes TTS traditionnels, OuteTTS ne nécessite pas d'adaptateurs externes ou d'architectures complexes. Le modèle est basé sur l'architecture LLaMa...
Il y a 6 mois
01.9K
PodLM:将对话、网页或长文本生成多语言音频播客(付费)

PodLM : Générer des podcasts audio multilingues de dialogues, de pages web ou de textes longs (payant)

Introduction générale PodLM est une plateforme de génération de podcasts à base d'IA conçue pour aider les utilisateurs à convertir rapidement des textes, des documents ou des contenus URL en podcasts audio de haute qualité. En s'appuyant sur une technologie d'IA de pointe, PodLM est capable de générer automatiquement des scripts de podcasts structurés et...
Il y a 10 mois
02.1K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

SoniTranslate : Solution de doublage de traduction vidéo open source, doublage multiple, ajustement de la vitesse et imitation du son original

Description générale SoniTranslate est un outil de doublage vidéo multilingue puissant et convivial, conçu pour fournir une solution de traduction vidéo et de synchronisation audio. Il utilise des technologies avancées de reconnaissance vocale et de traduction automatique pour traduire le contenu vidéo en plusieurs langues et maintenir l'audio synchronisé. Le ...
Il y a 10 mois
03.9K
逗哥配音:专注短视频解说、创作的智能配音神器

Teaser Dubbing : un outil de doublage intelligent axé sur la narration et la création de vidéos courtes

Introduction complète Tease Dubbing est un logiciel de doublage AI populaire qui compte plus de 5 millions d'utilisateurs. Le logiciel utilise la technologie avancée de doublage intelligent AI pour fournir des effets de doublage professionnels et réalistes, qui conviennent aux vidéos courtes, à la production de publicités, à l'éducation et à la formation et à d'autres scénarios. Teaser Dubbing s'engage à fournir aux utilisateurs des...
Il y a 10 mois
01.8K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音

Doublage YouTube : traduction de vidéos YouTube dans différentes langues et synchronisation du doublage en temps réel

Introduction générale YouTube Dubbing est une plateforme de doublage intelligente conçue pour fournir des services de doublage multilingue aux créateurs de vidéos et aux spectateurs. Grâce à la technologie de l'intelligence artificielle, la plateforme est capable de traduire et de générer automatiquement des doublages à partir de vidéos YouTube, en prenant en charge plusieurs langues et styles de voix. Les utilisateurs n'ont qu'à installer...
Il y a 10 mois
02K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy : Outil de conversation audio multilingue à partir de contenus multisources, une alternative open source aux capacités de podcasting de NotebookLM

Introduction générale Podcastfy est un paquetage Python open source qui utilise la technologie d'intelligence artificielle générative (GenAI) pour convertir du contenu web, des fichiers PDF, du texte, des images, des vidéos youtube et bien d'autres sources en...
Il y a 10 mois
01.8K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook : une clé pour générer des livres audio de qualité sonore naturelle, prise en charge des formats PDF, epub, docx et autres.

Introduction complète QuickPiperAudiobook est un projet open source conçu pour convertir une variété de formats de texte (e.g. epub, mobi, txt, PDF, HTML, etc.) en livres audio à la sonorité naturelle par le biais d'une simple commande. L'outil utilise Pi...
Il y a 10 mois
01.6K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI : Synthèse vocale intelligente et plateforme de clonage vocal

Introduction détaillée Seaweed AI est un produit de doublage intelligent qui peut convertir du texte en voix en ligne, grâce à la plateforme ouverte Yun Zhisheng AI. Les utilisateurs peuvent s'aider eux-mêmes à réaliser le clonage de voix, et fournir des prononciateurs IA de différents sexes, accents et langues, et doubler directement la voix après avoir saisi le texte. Il peut rapidement doubler des...
Il y a 10 mois
02K
Descript:一站式视频与播客编辑,简单如编辑文档

Descript : édition de vidéos et de podcasts en une seule étape, aussi simple que l'édition d'un document

Descript Description générale Descript est un outil d'édition de vidéos et de podcasts à la fois puissant et facile à utiliser. Il offre une précision et une vitesse de transcription inégalées dans l'industrie et de puissants outils de correction, ainsi que la possibilité de transcrire des vidéos en texte grâce à la technologie AI et d'éditer des vidéos en modifiant le texte. En plus de...
Il y a 10 mois
02.1K
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器

Murf AI : Changeur de voix|Speech to Text|Text to Speech|Audio Editor

Introduction générale Murf AI est un puissant outil de génération de voix d'intelligence artificielle en ligne qui convertit le texte en une voix humaine presque réelle. Il offre jusqu'à 120+ options de voix d'IA, supporte plus de 20 langues et convient à une variété de situations telles que les podcasts, les vidéos, les présentations professionnelles, etc.Mu...
Il y a 10 mois
02.3K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI : Plate-forme de synthèse vocale d'intelligence artificielle | Clonage de voix | Détection profonde de faux sons

Introduction générale Resemble AI est une plateforme de synthèse vocale par intelligence artificielle conçue pour les entreprises. La plateforme offre une technologie de pointe de génération de voix par l'IA et de détection des faux sons en profondeur pour la sécurité future de l'information. Les fonctionnalités comprennent le clonage de voix, la détection en temps réel des faux sons profonds, la technologie de filigrane d'IA...
Il y a 10 mois
02K
Ondoku:在线文本朗读工具|文本转语音|图片转语音朗读

Ondoku : Lecteur de texte en ligne|Texte à la parole|Image à la parole

Ondoku Introduction générale Ondoku est un logiciel de synthèse vocale en ligne qui permet aux utilisateurs de saisir un texte dans la zone de texte fournie par le site web. Le logiciel est capable de convertir l'article en une lecture vocale en fonction des besoins de l'utilisateur et permet de sauvegarder la voix sous forme de fichier au format MP3. Ce service convient à la fois à l'écoute instantanée...
Il y a 10 mois
02.1K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro : outil professionnel d'édition audio en ligne|production de livres audio|text to speech|séparation des accompagnements

Introduction générale XAudioPro est un outil avancé d'édition et de transcodage audio en ligne et en temps réel, à la fois professionnel et portable. Il prend en charge des fonctions d'édition audio professionnelles telles que le découpage, le recadrage, la copie, la suppression, la restauration et le contrôle du gain d'amplitude. Il offre également des services de débruitage tels que la réduction du bruit par soustraction spectrale, le...
Il y a 10 mois
01.7K
Hume AI:赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI : Donner à l'IA les moyens de reconnaître les émotions | Reconnaître les états émotionnels à partir de sons et d'expressions | Générer des discours avec des états émotionnels

Introduction générale Hume AI est une entreprise d'IA spécialisée dans l'intelligence émotionnelle, qui développe des technologies d'IA multimodales capables de comprendre les émotions humaines et d'y répondre. Son produit phare, l'interface vocale empathique (EVI), est capable de reconnaître et de répondre aux...
Il y a 10 mois
01.7K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop : plateforme professionnelle de création de voix-off et de narration de courtes vidéos | voix-off d'une personne réelle | voix de clone | en un seul clic dans un film

Introduction complète Magic Voice Workshop est une plateforme unique de doublage de courtes vidéos et d'IA qui fournit des informations sur le doublage logiciel, le doublage en conditions réelles, les bibliothèques sonores, les services de clonage et bien plus encore. La plateforme intègre des outils d'édition audio, de génération de copies d'IA, d'édition vidéo et de collaboration pour les services liés à l'audio et la création de contenu. Les utilisateurs découvrent l'éditeur audio...
Il y a 10 mois
01.6K
EmotiVoice(易魔声):多声音与情感提示控制的文本转语音引擎

EmotiVoice : moteur de synthèse vocale avec contrôle des voix multiples et des émotions

Introduction EmotiVoice est un moteur de synthèse vocale (TTS) doté de plusieurs voix et d'un contrôle des indices émotionnels, développé par NetEaseYoudao. Ce moteur TTS open source prend en charge l'anglais et le chinois, possède plus de 2000 voix différentes et dispose d'une capacité de synthèse des émotions permettant de créer des voix...
il y a 5 mois
02.2K
Listnr:多语言AI语音生成器,变革性人声合成技术

Listnr : Générateur de parole multilingue, technologie transformative de synthèse de la voix humaine

Introduction générale Listnr est un logiciel de synthèse vocale doté d'un moteur d'IA génératif qui crée une synthèse vocale avec plus de 1 000 voix différentes dans plus de 142 langues, y compris le clonage de votre propre voix. La plateforme dessert plus d'un million d'utilisateurs à travers de courtes vidéos, YouTub...
Il y a 10 mois
01.5K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck : musique rap générée par l'IA et plateforme de clonage vocal | Text to Speech

Introduction générale Uberduck AI est une plateforme innovante qui propose aux agences créatives, aux producteurs de musique et aux programmeurs une synthèse IA des voix chantées et parlées. Les utilisateurs peuvent choisir différents rythmes musicaux, générer des paroles à l'aide de l'IA ou écrire leurs propres paroles, sélectionner des sons spécifiques et enfin créer des chansons de rap...
Il y a 11 mois
02K
NotebookLM:知识笔记检索阅读,多类文档生成语音对话播客

NotebookLM : Extraction de notes de connaissance, lecture, génération de documents multi-classes, dialogue vocal, podcasts

Introduction générale NotebookLM est un outil de collaboration personnalisé de Google, conçu pour aider les utilisateurs à exploiter pleinement leur esprit. Les utilisateurs peuvent télécharger des documents et NotebookLM maîtrise instantanément le contenu de ces sources, ce qui facilite la lecture...
Il y a 2 mois
02.2K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe : Plate-forme unique de traitement audio/vidéo|Génération vidéo|Sous-titres IA|Extraction audio|Speech to Text

Introduction complète Record Cafe est une plateforme de traitement audio/vidéo à guichet unique, qui fournit des services de dialogue vidéo IA, de sous-titres IA et de conversion de la parole en texte IA. Les fonctions comprennent l'enregistrement d'écran, l'édition vidéo, la conversion GIF/audio, etc., et prennent en charge le stockage et le partage dans le nuage. L'interface est intuitive et facile à utiliser. Elle prend également en charge l'enregistrement multi-écrans et les...
Il y a 8 mois
02.2K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan : outil de synthèse vocale multilingue rapide et contrôlable (plus de 7000 langues prises en charge)

Introduction générale IMS Toucan est une boîte à outils de synthèse vocale de pointe développée par l'Institut de traitement du langage naturel (IMS) de l'Université de Stuttgart, en Allemagne. Cette boîte à outils prend en charge plus de 7 000 langues. Elle est rapide, contrôlable et peu gourmande en ressources informatiques....
Il y a 6 mois
01.9K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS : un modèle de génération de la parole qui imite la voix d'une personne réelle qui parle (ChatTTS one-click acceleration package)

Introduction générale ChatTTS est un modèle de parole génératif conçu pour les scénarios de dialogue. Il génère une parole naturelle et expressive, prend en charge plusieurs langues et plusieurs locuteurs, et convient aux dialogues interactifs. Pour ce faire, le modèle prédit et contrôle des caractéristiques rythmiques fines telles que les rires, les pauses et les interjections, sup...
Il y a 6 mois
02K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS : Outil de synthèse vocale en ligne gratuit|Augmentation audio|Clips audio

FreeTTS Description générale FreeTTS est un outil de synthèse vocale en ligne gratuit qui permet aux utilisateurs de convertir du texte en fichiers vocaux au son naturel. Prenant en charge plusieurs langues et options sonores, les utilisateurs peuvent convertir du texte aux formats MP3, WAV, OGG et ACC...
Il y a 11 mois
02.8K
ElevenLabs:高质量AI语音生成平台,文字配音和语音克隆工具

ElevenLabs : Plate-forme de génération de discours IA de haute qualité, outils de doublage de texte et de clonage de discours

Introduction générale ElevenLabs est une startup basée à New York, aux États-Unis, spécialisée dans le domaine de l'IA générative de la parole. L'entreprise propose une gamme de services performants pour la génération de texte, la génération de parole, le clonage de la parole et la reconnaissance vocale....
Il y a 11 mois
02.2K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit : kit d'outils vocaux pour un déploiement local

Introduction complète Easy-Voice-Toolkit est une boîte à outils multifonctionnelle basée sur l'Open Source Speech Project, fournissant une large gamme d'outils audio automatisés pour la reconnaissance vocale, la transcription vocale, la conversion vocale, la création d'ensembles de données et l'entraînement de modèles. Les utilisateurs peuvent utiliser ces outils de manière sélective en fonction de leurs besoins...
Il y a 11 mois
02.1K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人

DupDub : Editeur vidéo|Dubbing|Traduction vidéo|Numériseur photo alimenté par l'IA

Description générale Dupdub est une plateforme de création de podcasts et de présentations vidéo qui offre une gamme d'outils d'intelligence artificielle pour soutenir la créativité des utilisateurs. Les fonctionnalités couvrent la création de texte à la vidéo, offrant des services de doublage de voix et de vidéo par l'IA, ainsi que l'édition, la transcription et le sous-titrage de vidéos. Dupdub est également ...
Il y a 12 mois
01.8K
TTSMaker:免费的在线文本转语音工具

TTSMaker : outil de synthèse vocale en ligne gratuit

Introduction générale TTSMaker est un outil de synthèse vocale en ligne gratuit qui prend en charge plus de 100 langues et 300 styles vocaux. Les utilisateurs peuvent convertir des textes en paroles naturelles et fluides et télécharger des fichiers audio pour une utilisation commerciale. L'outil convient pour le doublage vidéo, les livres audio, l'éducation et la formation...
Il y a 12 mois
02.1K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI : Générer des vidéos de discours humains numériques avec une seule photo, plusieurs outils de génération de vidéos gratuits

Description générale Vidnoz est une plateforme gratuite de génération de vidéos d'IA qui permet de créer rapidement des vidéos d'IA en moins d'une minute. Aucun coût, téléchargement ou expérience n'est requis. La plateforme propose plus de 500 avatars IA, plus de 470 voix off IA réalistes et plus de 500 modèles. Avec Vidnoz AI video...
Il y a 12 mois
02.4K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI : client natif pour le sous-titrage de vidéos, conversion de sous-titres multilingues

Description générale MemoAI est un puissant outil de traduction vidéo conçu pour convertir des fichiers vidéo et audio en texte, sous-titres et notes. Qu'il s'agisse d'une vidéo YouTube, d'un podcast ou d'un fichier local, MemoAI peut le gérer facilement. Il prend en charge plus de 90 langues telles que le chinois, l'anglais, le japonais...
Il y a 8 mois
02.5K
腾讯智影:智能视频创作工具|AI数字人、动漫生成套件

Tencent Smart Shadow : Outil de création vidéo intelligent | AI Digital Man, Anime Generation Kit

Introduction Tencent Smart Shadow est une plateforme de création vidéo intelligente en ligne lancée par Tencent, qui peut prendre en charge le doublage de texte, la diffusion humaine numérique, la reconnaissance automatique des sous-titres et d'autres fonctions grâce à de puissants outils d'IA fournis par des services en nuage.
il y a 1 an
02.3K
音剪:喜马拉雅自然人声、多人旁白音频创作平台

Coupure de son : la voix humaine naturelle d'Himalaya, plateforme de création audio multi-narrateurs

Introduction complète Himalaya Audio Editor est une plateforme complète de création audio AI. Elle offre des fonctionnalités puissantes qui aident les utilisateurs à produire des podcasts de qualité professionnelle, à enregistrer sur plusieurs pistes, à éditer l'audio et à convertir le texte en parole. La plateforme contient également de nombreuses options pour la voix professionnelle, aidant les utilisateurs...
il y a 1 an
02.3K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS : générer des modèles de synthèse vocale spécifiques au locuteur à partir d'un texte d'entrée

Introduction générale Parler-TTS est une bibliothèque de modèles de synthèse vocale (TTS) open source développée par Hugging Face, conçue pour générer une parole de haute qualité et à consonance naturelle. Le modèle est capable de générer de la parole à partir d'un texte d'entrée avec un style de locuteur spécifique (par exemple, le genre, la hauteur, le style d'élocution...
Il y a 6 mois
01.6K