IA Parole au texte

Total 56 articles
Abogen:将多种文本格式转换为有声读物的工具

Abogen : un outil pour convertir de multiples formats de texte en livres audio

Introduction générale Abogen est un outil open source conçu pour convertir rapidement des fichiers ePub, PDF ou texte en audio de haute qualité. Il utilise le modèle Kokoro-82M pour générer une parole naturelle et fluide, et prend en charge la génération simultanée de sous-titres, ce qui convient à la production de livres audio...
Il y a 3 mois
0977
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio : traitement audio open source et modèle de base de dialogue

Introduction générale Kimi-Audio est un modèle de base audio open source développé par Moonshot AI, qui se concentre sur la compréhension, la génération et le dialogue audio. Il prend en charge un large éventail de tâches de traitement audio telles que la reconnaissance vocale, les questions-réponses audio et la reconnaissance des émotions vocales. Le modèle a été testé sur plus de 130...
Il y a 3 mois
01.1K
On Device AI:iPhone本地运行的AI语音转录与聊天工具

On Device AI : Outil de transcription vocale et de chat pour iPhone Native Running

Introduction générale On-Device AI est une application d'IA qui fonctionne complètement hors ligne, conçue pour les appareils Apple, prenant en charge iOS, macOS et visionOS.Elle permet l'exécution locale de modèles de langage à grande échelle (LLM), la transcription vocale en temps réel, l'analyse de documents, et plus encore, sans qu'il soit nécessaire de relier...
Il y a 3 mois
01.1K
Vexa:实时会议转录与智能知识提取工具

Vexa : un outil de transcription de réunions en temps réel et d'extraction intelligente de connaissances

Introduction complète Vexa est une plateforme open source de transcription de réunions en temps réel et de gestion des connaissances conçue pour fournir des services efficaces d'enregistrement de réunions et d'extraction intelligente de connaissances aux entreprises et aux particuliers. Elle rejoint automatiquement des plateformes telles que Google Meet, Zoom, etc. grâce à des robots de réunion pilotés par l'API...
Il y a 4 mois
01.2K
Transkriptor:将音频和视频转为文字的AI智能转录工具

Transkriptor : l'outil de transcription intelligent qui transforme l'audio et la vidéo en texte

Introduction générale Transkriptor est un outil de transcription piloté par l'IA qui se concentre sur la conversion rapide d'audio et de vidéo en texte. Il prend en charge plus de 100 langues avec un taux de précision allant jusqu'à 99% et convient à un large éventail de scénarios tels que les réunions, les entretiens, les notes de classe, etc. Les utilisateurs peuvent télécharger des fichiers,...
Il y a 4 mois
01.3K
Otter.ai:智能会议助手与实时语音转录工具

Otter.ai : assistant de réunion intelligent avec outil de transcription vocale en temps réel

Description générale Otter.ai est un outil de gestion de réunion et de transcription vocale alimenté par l'IA, dont la fonctionnalité principale consiste à convertir la voix en texte en temps réel et à générer automatiquement des notes de réunion, des résumés et des éléments d'action. Il est intelligemment soutenu par un agent de réunion IA qui ajoute automatiquement...
Il y a 4 mois
01.1K
TurboScribe:快速将音频和视频转为文字的在线工具

TurboScribe : l'outil en ligne pour convertir rapidement l'audio et la vidéo en texte

Description générale TurboScribe est un outil de transcription basé sur l'IA qui se concentre sur la conversion rapide de l'audio et de la vidéo en texte. Il prend en charge plus de 98 langues avec un taux de précision de 99,8% pour les utilisateurs qui ont besoin de traiter efficacement le contenu vocal. Les utilisateurs peuvent télécharger des fichiers, générer des notes de texte...
Il y a 4 mois
01.2K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin : Reconnaissance des langues asiatiques et modélisation de la parole vers le texte pour les langues asiatiques

Introduction complète Dolphin est un modèle open source développé par DataoceanAI et l'université de Tsinghua, qui se concentre sur la reconnaissance vocale et linguistique pour les langues asiatiques. Il prend en charge 40 langues d'Asie de l'Est, d'Asie du Sud, d'Asie du Sud-Est et du Moyen-Orient, ainsi que 22 dialectes chinois...
Il y a 4 mois
01.1K
Meeting:本地实时转录和生成会议纪要的开源客户端

Réunion : transcription locale en temps réel et génération de comptes rendus de réunion du client open source

Introduction générale Meeting Minutes (alias Meetily) est un outil gratuit et open source d'assistant de réunion IA développé par Zackriya Solutions, qui se concentre sur la capture de l'audio des réunions en temps réel, la génération de texte transcrit et l'extraction automatique...
il y a 5 mois
01.3K
AssemblyAI:高精度语音转文字与音频智能分析平台

AssemblyAI : Plate-forme d'analyse de haute précision de la parole au texte et de l'intelligence audio

Introduction générale AssemblyAI est une plateforme axée sur la technologie de l'IA vocale, qui fournit aux développeurs et aux entreprises des outils efficaces d'analyse audio et de conversion de la parole au texte. Son point fort est la famille de modèles Universal, en particulier le nouveau modèle Universal-2...
il y a 5 mois
01.3K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR : Un modèle Open Source pour la reconnaissance vocale multilingue de haute précision

Introduction générale FireRedASR est un modèle de reconnaissance vocale développé par l'équipe du Little Red Book FireRed, dont l'objectif est de fournir des solutions de reconnaissance vocale automatique (ASR) de haute précision et supportées par plusieurs langues. Le projet est hébergé sur GitHub pour les développeurs et les chercheurs, et offre...
il y a 5 mois
01.4K
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain : conversion de la parole en texte en temps réel et optimisation des mots prononcés

Introduction générale WhisperChain est un projet open source basé sur l'IA, hébergé sur GitHub et dirigé par le développeur Chris Choy. Il est principalement utilisé pour convertir la parole en texte et optimiser automatiquement l'expression grâce à la technologie de l'IA, en supprimant les redondances...
il y a 5 mois
01.3K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer : lecteur vidéo qui génère des sous-titres en temps réel avec traduction bilingue

Introduction générale LLPlayer est un lecteur multimédia open source pour les apprenants de langues, hébergé sur GitHub et créé par le développeur umlx5h. Il intègre une variété de fonctionnalités utiles telles que l'affichage des sous-titres bilingues, les sous-titres générés automatiquement par l'IA, la traduction en temps réel et la recherche de mots...
Il y a 2 mois
02.4K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora : Extraction de sous-titres de livres audio et traduction multilingue, transcription de livres audio en plusieurs langues

Introduction LiberSonora, qui signifie "son libre", est un puissant ensemble d'outils de livres audio open source basé sur l'intelligence artificielle. Il prend en charge l'extraction intelligente de sous-titres, la génération de titres par l'IA, la traduction multilingue, etc. et est capable d'effectuer un traitement hors ligne par lots sous accélération GPU.LiberSo...
Il y a 6 mois
01.4K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate : une API unifiée pour l'intégration de la génération de parole Well-Known, de la transcription de la parole et de la modélisation de la voix

Introduction générale Orate est une boîte à outils d'IA axée sur la génération et la transcription de la parole. Il fournit une API unifiée qui s'intègre de manière transparente avec les principaux fournisseurs d'IA tels que OpenAI, ElevenLabs et AssemblyAI afin d'aider les utilisateurs à créer des...
Il y a 6 mois
01.8K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling : un outil de synthèse vocale multilingue plus petit et plus rapide que Whisper-Large v3

Introduction complète PengChengStarling (PengCheng Labs) est un outil multilingue de reconnaissance automatique de la parole (ASR) capable de convertir la parole dans différentes langues en texte correspondant. Cette boîte à outils est développée sur la base du projet icefall et fournit un processus complet de reconnaissance de la parole...
Il y a 6 mois
01.4K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT : outil de conversion de la parole en texte en temps réel pour la reconnaissance vocale en continu à faible latence basé sur Whisper

Introduction générale RealtimeSTT est une bibliothèque de conversion de la parole vers le texte en temps réel, efficace et à faible latence, avec une détection avancée de l'activité vocale et l'activation des mots de réveil. Elle a été développée par Kolja Beigel pour soutenir les applications qui nécessitent une conversion rapide et précise...
Il y a 7 mois
01.8K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust : Plateformes de services en ligne de génération de la parole par l'IA et de synthèse vocale (TTS)

Introduction générale Acoust est une plateforme de services en ligne de génération de discours par IA et de synthèse vocale qui utilise les dernières technologies d'IA pour générer des discours réalistes. La plateforme offre également de puissants outils d'édition vidéo qui permettent aux utilisateurs de réaliser des productions vidéo sans avoir recours à de multiples logiciels.
Il y a 7 mois
01.5K
Notta:AI会议记录与音频转录工具,自动转录会议、采访或录音

Notta : outil d'enregistrement de réunions et de transcription audio par l'IA pour transcrire automatiquement des réunions, des entretiens ou des enregistrements

Description générale Notta est un puissant outil d'enregistrement de réunions et de transcription audio conçu pour aider les utilisateurs à convertir automatiquement les réunions, les entretiens ou les enregistrements en texte consultable. Avec Notta, les utilisateurs peuvent facilement transcrire, éditer, résumer et collaborer pour augmenter la productivité....
Il y a 7 mois
02.1K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi : génération et traduction automatiques de sous-titres multilingues pour les vidéos à l'aide de l'IA

Introduction générale AI no jimaku gumi (AI no subtitle group) est un puissant outil de traitement des sous-titres vidéo en ligne de commande qui permet d'automatiser les fonctions d'extraction, de transcription et de traduction des sous-titres vidéo. L'outil intègre des technologies d'IA avancées, notamment la parole Whisper...
Il y a 7 mois
01.6K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip : montage intelligent de contenus vidéo en courts métrages, facilité d'extraction et de découpage précis de clips vidéo

Introduction complète FunClip est un outil d'édition vidéo automatisé et localisé, entièrement open source, développé par le TONGYI Speech Lab de l'Alibaba Dharma Institute. L'outil intègre le modèle de reconnaissance vocale Paraformer-Large de qualité industrielle, qui peut identifier avec précision la parole dans la vidéo...
Il y a 7 mois
01.9K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX : reconnaissance vocale automatique séparée du locuteur, fournissant des horodatages très précis au niveau des mots.

Introduction générale BetterWhisperX est une version optimisée du projet WhisperX visant à fournir des services de reconnaissance automatique de la parole (ASR) efficaces et précis. En tant que dérivé amélioré de WhisperX, le projet a été développé par Federico ...
Il y a 7 mois
02.1K
Freed:AI医疗抄写助手,准确转录医生和患者对话,减少就诊记录文书工作

Freed : assistant de transcription médicale par IA qui transcrit avec précision les conversations entre le médecin et le patient et réduit la paperasserie liée à la visite.

Description générale Freed est un assistant de transcription médicale conçu pour les professionnels de la santé. Il aide les médecins et autres professionnels de la santé à automatiser l'enregistrement des visites des patients, à réduire la paperasserie et à améliorer l'efficacité du travail grâce à une technologie d'IA avancée....
Il y a 8 mois
01.9K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容

Voicenotes : notes vocales AI, enregistrement et transcription de la voix, gestion intelligente du contenu des réunions

Introduction générale Voicenotes est une application de notes vocales intelligente conçue pour aider les utilisateurs à enregistrer et à gérer facilement des notes vocales et des réunions. L'application prend en charge la transcription vocale dans plus de 100 langues. Les utilisateurs n'ont qu'à prononcer leurs pensées et Voicenotes les transcrit automatiquement en texte...
Il y a 8 mois
01.9K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro : outil de traduction vidéo multifonctionnel open source, transcription et traduction de la voix en plusieurs langues, installation en un seul clic sous Windows

Introduction générale Voice-Pro est un outil polyvalent basé sur Gradio WebUI qui prend en charge la synthèse vocale, la synthèse vocale, la traduction en temps réel, le téléchargement de vidéos YouTube et la séparation de la voix humaine. Il intègre Whisper, Faster-Wh...
Il y a 9 mois
02.1K
Zamzar:多功能在线文件格式转换工具,视频转换|音频转换|图片转换|文档转换

Zamzar : outil multifonctionnel de conversion de formats de fichiers en ligne, conversion vidéo | conversion audio | conversion d'images | conversion de documents

Introduction générale Zamzar est un puissant outil de conversion de fichiers en ligne qui prend en charge plus de 1200 formats de fichiers. Qu'il s'agisse de documents, d'images, de vidéos, d'audios ou de livres électroniques, Zamzar peut le faire rapidement et efficacement. Les utilisateurs n'ont pas besoin de télécharger de logiciel...
Il y a 9 mois
03.2K
AI Hear:本地离线运行的实时语音转录与翻译软件

AI Hear : logiciel de transcription et de traduction vocale en temps réel fonctionnant nativement hors ligne

Description générale Si vous utilisez un MacBook, essayez AI Hear : vous pouvez enregistrer de l'audio, convertir la parole locale en temps réel en texte, traduire et éventuellement exporter des sous-titres. Vous pouvez l'utiliser pour écouter des réunions à l'étranger et des livres audio en anglais. AI Hear est un logiciel local qui permet d'enregistrer en temps réel et en un seul clic...
Il y a 9 mois
02K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

SoniTranslate : Solution de doublage de traduction vidéo open source, doublage multiple, ajustement de la vitesse et imitation du son original

Description générale SoniTranslate est un outil de doublage vidéo multilingue puissant et convivial, conçu pour fournir une solution de traduction vidéo et de synchronisation audio. Il utilise des technologies avancées de reconnaissance vocale et de traduction automatique pour traduire le contenu vidéo en plusieurs langues et maintenir l'audio synchronisé. Le ...
Il y a 10 mois
03.8K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR : boîte à outils de reconnaissance vocale open source, séparation du locuteur / reconnaissance vocale de dialogues multi-personnes

Introduction complète FunASR est une boîte à outils de reconnaissance vocale open-source développée par l'Alibaba Dharmo Academy pour faire le lien entre la recherche académique et les applications industrielles. Il prend en charge un large éventail de fonctions de reconnaissance vocale, notamment la reconnaissance de la parole (ASR), la détection des terminaisons vocales (VAD), la récupération de la ponctuation, la modélisation de la langue, la...
Il y a 10 mois
02.6K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools : outil de conversion de la parole en sous-titres, client léger avec interfaces intégrées pour Cutscene, Racer et Must-Cut

Introduction AsrTools est un outil de synthèse vocale intelligent avec des interfaces intégrées de grands acteurs comme Cutscene, QuickScope, MustCut, etc. Il ne nécessite pas de GPU ou de configuration encombrante, et supporte un traitement par lots efficace et multithread. Il est basé sur le développement PyQt5, une interface belle et conviviale, capable de produire des mots aux formats SRT et TXT...
Il y a 10 mois
02.7K
Happy Scribe:音频转录和视频字幕平台|免费视频字幕编辑软件

Happy Scribe : plateforme de transcription audio et de sous-titrage vidéo | Logiciel de sous-titrage vidéo gratuit

Happy Scribe Description générale Happy Scribe fournit des services de transcription audio automatisés et manuels pour convertir l'audio en texte avec une grande précision et la prise en charge de plusieurs langues et formats. Il comprend un éditeur interactif, des outils de collaboration, plusieurs formats d'exportation, la traduction automatique et d'autres fonctionnalités...
Il y a 10 mois
02.2K
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器

Murf AI : Changeur de voix|Speech to Text|Text to Speech|Audio Editor

Introduction générale Murf AI est un puissant outil de génération de voix d'intelligence artificielle en ligne qui convertit le texte en une voix humaine presque réelle. Il offre jusqu'à 120+ options de voix d'IA, supporte plus de 20 langues et convient à une variété de situations telles que les podcasts, les vidéos, les présentations professionnelles, etc.Mu...
Il y a 10 mois
02.3K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具

VideoLingo : outils open source de transcription vidéo, de traduction de sous-titres vidéo et de doublage localisé.

Description générale VideoLingo est un outil de traduction et de localisation de vidéos conçu pour générer des sous-titres de haute qualité de type Netflix, en éliminant la traduction automatique brute et les sous-titres multilignes, et en ajoutant des voix off de haute qualité pour permettre le partage de connaissances globales au-delà des barrières linguistiques. En...
Il y a 10 mois
01.8K
ALog:便携AI语音日记应用,支持语音转文字。

ALog : application portable de journal vocal AI avec prise en charge de la synthèse vocale.

Introduction générale ALog est une application de journal vocal basée sur l'IA conçue pour aider les utilisateurs à enregistrer leur vie quotidienne par la voix. Elle est développée par duxins et en libre accès sur GitHub. Les utilisateurs peuvent enregistrer des entrées de journal par saisie vocale, et l'application convertit automatiquement la voix en texte...
Il y a 7 mois
02.1K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe : Plate-forme unique de traitement audio/vidéo|Génération vidéo|Sous-titres IA|Extraction audio|Speech to Text

Introduction complète Record Cafe est une plateforme de traitement audio/vidéo à guichet unique, qui fournit des services de dialogue vidéo IA, de sous-titres IA et de conversion de la parole en texte IA. Les fonctions comprennent l'enregistrement d'écran, l'édition vidéo, la conversion GIF/audio, etc., et prennent en charge le stockage et le partage dans le nuage. L'interface est intuitive et facile à utiliser. Elle prend également en charge l'enregistrement multi-écrans et les...
Il y a 8 mois
02K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS : Outil de synthèse vocale en ligne gratuit|Augmentation audio|Clips audio

FreeTTS Description générale FreeTTS est un outil de synthèse vocale en ligne gratuit qui permet aux utilisateurs de convertir du texte en fichiers vocaux au son naturel. Prenant en charge plusieurs langues et options sonores, les utilisateurs peuvent convertir du texte aux formats MP3, WAV, OGG et ACC...
Il y a 11 mois
02.6K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit : kit d'outils vocaux pour un déploiement local

Introduction complète Easy-Voice-Toolkit est une boîte à outils multifonctionnelle basée sur l'Open Source Speech Project, fournissant une large gamme d'outils audio automatisés pour la reconnaissance vocale, la transcription vocale, la conversion vocale, la création d'ensembles de données et l'entraînement de modèles. Les utilisateurs peuvent utiliser ces outils de manière sélective en fonction de leurs besoins...
Il y a 11 mois
02K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人

DupDub : Editeur vidéo|Dubbing|Traduction vidéo|Numériseur photo alimenté par l'IA

Description générale Dupdub est une plateforme de création de podcasts et de présentations vidéo qui offre une gamme d'outils d'intelligence artificielle pour soutenir la créativité des utilisateurs. Les fonctionnalités couvrent la création de texte à la vidéo, offrant des services de doublage de voix et de vidéo par l'IA, ainsi que l'édition, la transcription et le sous-titrage de vidéos. Dupdub est également ...
Il y a 12 mois
01.8K
通义听悟:阿里通义音视频内容转录AI助手

Tongyi Écouter et comprendre : Ali Tongyi Assistant IA de transcription de contenu audio et vidéo

Introduction complète Tongyi Listening and Understanding est un assistant IA en alternance lancé par Aliyun, qui se concentre sur la transcription et l'analyse de contenus audio et vidéo. Il s'appuie sur les puissants modèles d'IA d'AliCloud pour transcrire les contenus audio et vidéo en texte en temps réel, et propose des fonctions de traduction, de résumé, de positionnement et autres. Tongyi Listening Woo prend en charge plusieurs langues et scénarios...
Il y a 11 mois
01.8K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI : client natif pour le sous-titrage de vidéos, conversion de sous-titres multilingues

Description générale MemoAI est un puissant outil de traduction vidéo conçu pour convertir des fichiers vidéo et audio en texte, sous-titres et notes. Qu'il s'agisse d'une vidéo YouTube, d'un podcast ou d'un fichier local, MemoAI peut le gérer facilement. Il prend en charge plus de 90 langues telles que le chinois, l'anglais, le japonais...
Il y a 8 mois
02.4K