IA Parole au texte

Total 56 articles

mettre en ordre

Abogen : un outil pour convertir de multiples formats de texte en livres audio

Introduction générale Abogen est un outil open source conçu pour convertir rapidement des fichiers ePub, PDF ou texte en audio de haute qualité. Il utilise le modèle Kokoro-82M pour générer une parole naturelle et fluide, et prend en charge la génération simultanée de sous-titres, ce qui convient à la production de livres audio...

il y a 5 mois

023.2K

Kimi-Audio : traitement audio open source et modèle de base de dialogue

Introduction générale Kimi-Audio est un modèle de base audio open source développé par Moonshot AI, qui se concentre sur la compréhension, la génération et le dialogue audio. Il prend en charge un large éventail de tâches de traitement audio telles que la reconnaissance vocale, les questions-réponses audio et la reconnaissance des émotions vocales. Le modèle a été testé sur plus de 130...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Synthèse vocale AI # AI Speech to Text

il y a 5 mois

017.9K

On Device AI : Outil de transcription vocale et de chat pour iPhone Native Running

Introduction générale On-Device AI est une application d'IA qui fonctionne complètement hors ligne, conçue pour les appareils Apple, prenant en charge iOS, macOS et visionOS.Elle permet l'exécution locale de modèles de langage à grande échelle (LLM), la transcription vocale en temps réel, l'analyse de documents, et plus encore, sans qu'il soit nécessaire de relier...

Dernières ressources sur l'IA # AI Localised Chat Application # AI Speech to Text

il y a 5 mois

017.2K

Vexa : un outil de transcription de réunions en temps réel et d'extraction intelligente de connaissances

Introduction complète Vexa est une plateforme open source de transcription de réunions en temps réel et de gestion des connaissances conçue pour fournir des services efficaces d'enregistrement de réunions et d'extraction intelligente de connaissances aux entreprises et aux particuliers. Elle rejoint automatiquement des plateformes telles que Google Meet, Zoom, etc. grâce à des robots de réunion pilotés par l'API...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outil de résumé de texte AI et d'audio/vidéo # AI Speech to Text

il y a 5 mois

023.2K

Outil open source pour la synthèse vocale en temps réel

Introduction générale realtime-transcription-fastrtc est un projet open source axé sur la conversion de la parole en texte en temps réel. Il utilise la technologie FastRTC pour traiter les flux audio à faible latence, combinée à un modèle Whisper local pour ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

il y a 5 mois

023.1K

Transkriptor : l'outil de transcription intelligent qui transforme l'audio et la vidéo en texte

Introduction générale Transkriptor est un outil de transcription piloté par l'IA qui se concentre sur la conversion rapide d'audio et de vidéo en texte. Il prend en charge plus de 100 langues avec un taux de précision allant jusqu'à 99% et convient à un large éventail de scénarios tels que les réunions, les entretiens, les notes de classe, etc. Les utilisateurs peuvent télécharger des fichiers,...

Dernières ressources sur l'IA # Outil de résumé de texte AI et d'audio/vidéo # AI Traduction # AI Speech to Text

il y a 5 mois

021.4K

Otter.ai : assistant de réunion intelligent avec outil de transcription vocale en temps réel

Description générale Otter.ai est un outil de gestion de réunion et de transcription vocale alimenté par l'IA, dont la fonctionnalité principale consiste à convertir la voix en texte en temps réel et à générer automatiquement des notes de réunion, des résumés et des éléments d'action. Il est intelligemment soutenu par un agent de réunion IA qui ajoute automatiquement...

Dernières ressources sur l'IA # Outil de résumé de texte AI et d'audio/vidéo # AI Speech to Text

il y a 5 mois

019.5K

TurboScribe : l'outil en ligne pour convertir rapidement l'audio et la vidéo en texte

Description générale TurboScribe est un outil de transcription basé sur l'IA qui se concentre sur la conversion rapide de l'audio et de la vidéo en texte. Il prend en charge plus de 98 langues avec un taux de précision de 99,8% pour les utilisateurs qui ont besoin de traiter efficacement le contenu vocal. Les utilisateurs peuvent télécharger des fichiers, générer des notes de texte...

Dernières ressources sur l'IA # AI Speech to Text

il y a 5 mois

022.8K

Aqua Voice : Générer un texte précis grâce à la saisie vocale inter-applications

Introduction générale Aqua Voice est un outil de génération de texte intelligent basé sur la parole et visant à convertir rapidement le discours de l'utilisateur en texte formaté. Il a été créé en 2023 par Finnian Brown et Jack McIntire et est basé aux États-Unis...

Dernières ressources sur l'IA # AI Speech to Text

il y a 5 mois

030.2K

Dolphin : Reconnaissance des langues asiatiques et modélisation de la parole vers le texte pour les langues asiatiques

Introduction complète Dolphin est un modèle open source développé par DataoceanAI et l'université de Tsinghua, qui se concentre sur la reconnaissance vocale et linguistique pour les langues asiatiques. Il prend en charge 40 langues d'Asie de l'Est, d'Asie du Sud, d'Asie du Sud-Est et du Moyen-Orient, ainsi que 22 dialectes chinois...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

il y a 5 mois

018.6K

TwinMind : application gratuite de transcription hors ligne de la voix vers le texte

TwinMind est un outil intelligent développé par ThirdEar AI, Inc. qui "vous aide à vous souvenir de tout". Il peut enregistrer et convertir en texte des conversations, des réunions ou des conférences en temps réel, dans plus de 100 langues, même avec votre téléphone dans votre poche, et...

Dernières ressources sur l'IA # Outil de résumé de texte AI et d'audio/vidéo # AI Speech to Text

Il y a 6 mois

018.4K

Wispr Flow : utilisez votre voix pour saisir rapidement du texte dans n'importe quelle application

Description générale Wispr Flow est un outil de saisie de texte par la voix, aidant les utilisateurs à écrire rapidement sur leurs ordinateurs. Il s'agit d'une expérience "3x plus rapide que la frappe" qui permet aux utilisateurs d'entrer du texte dans n'importe quelle application telle que Word, Slack ou G...

Dernières ressources sur l'IA # AI Speech to Text

Il y a 3 mois

033.4K

Réunion : transcription locale en temps réel et génération de comptes rendus de réunion du client open source

Introduction générale Meeting Minutes (alias Meetily) est un outil gratuit et open source d'assistant de réunion IA développé par Zackriya Solutions, qui se concentre sur la capture de l'audio des réunions en temps réel, la génération de texte transcrit et l'extraction automatique...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outil de résumé de texte AI et d'audio/vidéo # AI Speech to Text

Il y a 6 mois

022.4K

Local-NotebookLM : PDF local pour générer des podcasts vocaux d'outils open source

Introduction complète Local-NotebookLM est un projet open source qui vise à fournir des outils intelligents de traitement de documents et de génération de contenu exécutés localement. Il s'inspire de Google NotebookLM , en aidant les utilisateurs à transformer des documents PDF et autres en une variété de ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 6 mois

019.7K

AssemblyAI : Plate-forme d'analyse de haute précision de la parole au texte et de l'intelligence audio

Introduction générale AssemblyAI est une plateforme axée sur la technologie de l'IA vocale, qui fournit aux développeurs et aux entreprises des outils efficaces d'analyse audio et de conversion de la parole au texte. Son point fort est la famille de modèles Universal, en particulier le nouveau modèle Universal-2...

Dernières ressources sur l'IA # AI Open Services # AI Speech to Text

Il y a 7 mois

019.6K

FireRedASR : Un modèle Open Source pour la reconnaissance vocale multilingue de haute précision

Introduction générale FireRedASR est un modèle de reconnaissance vocale développé par l'équipe du Little Red Book FireRed, dont l'objectif est de fournir des solutions de reconnaissance vocale automatique (ASR) de haute précision et supportées par plusieurs langues. Le projet est hébergé sur GitHub pour les développeurs et les chercheurs, et offre...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 7 mois

024.9K

WhisperChain : conversion de la parole en texte en temps réel et optimisation des mots prononcés

Introduction générale WhisperChain est un projet open source basé sur l'IA, hébergé sur GitHub et dirigé par le développeur Chris Choy. Il est principalement utilisé pour convertir la parole en texte et optimiser automatiquement l'expression grâce à la technologie de l'IA, en supprimant les redondances...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 7 mois

017.9K

LLPlayer : lecteur vidéo qui génère des sous-titres en temps réel avec traduction bilingue

Introduction générale LLPlayer est un lecteur multimédia open source pour les apprenants de langues, hébergé sur GitHub et créé par le développeur umlx5h. Il intègre une variété de fonctionnalités utiles telles que l'affichage des sous-titres bilingues, les sous-titres générés automatiquement par l'IA, la traduction en temps réel et la recherche de mots...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Traduction # AI Speech to Text

Il y a 3 mois

029.4K

CapsWriter-Offline : Outil de saisie vocale et de transcription des sous-titres pour le PC

Introduction générale CapsWriter-Offline est un outil de saisie vocale et de transcription de sous-titres pour PC, hébergé sur GitHub et construit par le développeur HaujetZhao. Il fonctionne complètement hors ligne et ne nécessite pas de connexion internet pour la transcription...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 7 mois

018.6K

Whisper Input : un service gratuit et rapide de transcription de la voix au texte utilisant Groq

Description générale Whisper Input est un outil de transcription vocale open source qui permet aux utilisateurs de commencer l'enregistrement de la voix en appuyant sur le bouton Option et de terminer l'enregistrement en levant le bouton. L'outil appelle Groq Whisper Large V3 Turbo ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 7 mois

022K

LiberSonora : Extraction de sous-titres de livres audio et traduction multilingue, transcription de livres audio en plusieurs langues

Introduction LiberSonora, qui signifie "son libre", est un puissant ensemble d'outils de livres audio open source basé sur l'intelligence artificielle. Il prend en charge l'extraction intelligente de sous-titres, la génération de titres par l'IA, la traduction multilingue, etc. et est capable d'effectuer un traitement hors ligne par lots sous accélération GPU.LiberSo...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Traduction # AI Speech to Text

Il y a 7 mois

017.8K

AudioNotes : Extraction rapide de contenus audio et vidéo et génération de notes structurées

Introduction AudioNotes est un système de notes audio/vidéo structurées basé sur FunASR et Qwen2. Il peut rapidement extraire le contenu audio/vidéo et appeler le grand modèle pour générer des notes structurées en Markdown, ce qui est pratique pour...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 7 mois

018.2K

Orate : une API unifiée pour l'intégration de la génération de parole Well-Known, de la transcription de la parole et de la modélisation de la voix

Introduction générale Orate est une boîte à outils d'IA axée sur la génération et la transcription de la parole. Il fournit une API unifiée qui s'intègre de manière transparente avec les principaux fournisseurs d'IA tels que OpenAI, ElevenLabs et AssemblyAI afin d'aider les utilisateurs à créer des...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Synthèse vocale AI # AI Speech to Text

Il y a 8 mois

022.8K

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling : un outil de synthèse vocale multilingue plus petit et plus rapide que Whisper-Large v3

Introduction complète PengChengStarling (PengCheng Labs) est un outil multilingue de reconnaissance automatique de la parole (ASR) capable de convertir la parole dans différentes langues en texte correspondant. Cette boîte à outils est développée sur la base du projet icefall et fournit un processus complet de reconnaissance de la parole...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 8 mois

017.8K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT : outil de conversion de la parole en texte en temps réel pour la reconnaissance vocale en continu à faible latence basé sur Whisper

Introduction générale RealtimeSTT est une bibliothèque de conversion de la parole vers le texte en temps réel, efficace et à faible latence, avec une détection avancée de l'activité vocale et l'activation des mots de réveil. Elle a été développée par Kolja Beigel pour soutenir les applications qui nécessitent une conversion rapide et précise...

Nouvelles de l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 8 mois

021.8K

Sherpa-ONNX : Reconnaissance et synthèse vocale hors ligne avec ONNXRuntime

Introduction générale sherpa-onnx est un projet open source développé par l'équipe Next-gen Kaldi pour fournir des solutions efficaces de reconnaissance et de synthèse vocales hors ligne. Il prend en charge plusieurs plateformes, dont Android, iOS, Raspber...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Synthèse vocale AI # AI Speech to Text

Il y a 8 mois

052.6K

Acoust : Plateformes de services en ligne de génération de la parole par l'IA et de synthèse vocale (TTS)

Introduction générale Acoust est une plateforme de services en ligne de génération de discours par IA et de synthèse vocale qui utilise les dernières technologies d'IA pour générer des discours réalistes. La plateforme offre également de puissants outils d'édition vidéo qui permettent aux utilisateurs de réaliser des productions vidéo sans avoir recours à de multiples logiciels.

Dernières ressources sur l'IA # Synthèse vocale AI # AI Speech to Text

Il y a 8 mois

017.5K

Notta : outil d'enregistrement de réunions et de transcription audio par l'IA pour transcrire automatiquement des réunions, des entretiens ou des enregistrements

Description générale Notta est un puissant outil d'enregistrement de réunions et de transcription audio conçu pour aider les utilisateurs à convertir automatiquement les réunions, les entretiens ou les enregistrements en texte consultable. Avec Notta, les utilisateurs peuvent facilement transcrire, éditer, résumer et collaborer pour augmenter la productivité....

Dernières ressources sur l'IA # Outil de résumé de texte AI et d'audio/vidéo # AI Speech to Text

Il y a 8 mois

022.1K

AI no jimaku gumi : génération et traduction automatiques de sous-titres multilingues pour les vidéos à l'aide de l'IA

Introduction générale AI no jimaku gumi (AI no subtitle group) est un puissant outil de traitement des sous-titres vidéo en ligne de commande qui permet d'automatiser les fonctions d'extraction, de transcription et de traduction des sous-titres vidéo. L'outil intègre des technologies d'IA avancées, notamment la parole Whisper...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Traduction # AI Speech to Text

Il y a 9 mois

017K

FunClip : montage intelligent de contenus vidéo en courts métrages, facilité d'extraction et de découpage précis de clips vidéo

Introduction complète FunClip est un outil d'édition vidéo automatisé et localisé, entièrement open source, développé par le TONGYI Speech Lab de l'Alibaba Dharma Institute. L'outil intègre le modèle de reconnaissance vocale Paraformer-Large de qualité industrielle, qui peut identifier avec précision la parole dans la vidéo...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text # AI éditeur audio/vidéo

Il y a 9 mois

027.7K

BetterWhisperX : reconnaissance vocale automatique séparée du locuteur, fournissant des horodatages très précis au niveau des mots.

Introduction générale BetterWhisperX est une version optimisée du projet WhisperX visant à fournir des services de reconnaissance automatique de la parole (ASR) efficaces et précis. En tant que dérivé amélioré de WhisperX, le projet a été développé par Federico ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 9 mois

019.8K

Freed : assistant de transcription médicale par IA qui transcrit avec précision les conversations entre le médecin et le patient et réduit la paperasserie liée à la visite.

Description générale Freed est un assistant de transcription médicale conçu pour les professionnels de la santé. Il aide les médecins et autres professionnels de la santé à automatiser l'enregistrement des visites des patients, à réduire la paperasserie et à améliorer l'efficacité du travail grâce à une technologie d'IA avancée....

Dernières ressources sur l'IA # AI Speech to Text

Il y a 9 mois

017.2K

Voicenotes : notes vocales AI, enregistrement et transcription de la voix, gestion intelligente du contenu des réunions

Introduction générale Voicenotes est une application de notes vocales intelligente conçue pour aider les utilisateurs à enregistrer et à gérer facilement des notes vocales et des réunions. L'application prend en charge la transcription vocale dans plus de 100 langues. Les utilisateurs n'ont qu'à prononcer leurs pensées et Voicenotes les transcrit automatiquement en texte...

Dernières ressources sur l'IA # AI Notes # AI Speech to Text

Il y a 9 mois

019.5K

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Voice-Pro : outil de traduction vidéo multifonctionnel open source, transcription et traduction de la voix en plusieurs langues, installation en un seul clic sous Windows

Introduction générale Voice-Pro est un outil polyvalent basé sur Gradio WebUI qui prend en charge la synthèse vocale, la synthèse vocale, la traduction en temps réel, le téléchargement de vidéos YouTube et la séparation de la voix humaine. Il intègre Whisper, Faster-Wh...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Traduction # AI Speech to Text

Il y a 10 mois

021.8K

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换

Zamzar : outil multifonctionnel de conversion de formats de fichiers en ligne, conversion vidéo | conversion audio | conversion d'images | conversion de documents

Introduction générale Zamzar est un puissant outil de conversion de fichiers en ligne qui prend en charge plus de 1200 formats de fichiers. Qu'il s'agisse de documents, d'images, de vidéos, d'audios ou de livres électroniques, Zamzar peut le faire rapidement et efficacement. Les utilisateurs n'ont pas besoin de télécharger de logiciel...

Dernières ressources sur l'IA # AI Open Services # AI Speech to Text

Il y a 11 mois

023.4K

AI Hear : logiciel de transcription et de traduction vocale en temps réel fonctionnant nativement hors ligne

Description générale Si vous utilisez un MacBook, essayez AI Hear : vous pouvez enregistrer de l'audio, convertir la parole locale en temps réel en texte, traduire et éventuellement exporter des sous-titres. Vous pouvez l'utiliser pour écouter des réunions à l'étranger et des livres audio en anglais. AI Hear est un logiciel local qui permet d'enregistrer en temps réel et en un seul clic...

Dernières ressources sur l'IA # AI Traduction # AI Speech to Text

Il y a 11 mois

019.7K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

SoniTranslate : Solution de doublage de traduction vidéo open source, doublage multiple, ajustement de la vitesse et imitation du son original

Description générale SoniTranslate est un outil de doublage vidéo multilingue puissant et convivial, conçu pour fournir une solution de traduction vidéo et de synchronisation audio. Il utilise des technologies avancées de reconnaissance vocale et de traduction automatique pour traduire le contenu vidéo en plusieurs langues et maintenir l'audio synchronisé. Le ...

Dernières ressources sur l'IA # Synthèse vocale AI # AI Traduction # AI Speech to Text

Il y a 11 mois

032.5K

FunASR : boîte à outils de reconnaissance vocale open source, séparation du locuteur / reconnaissance vocale de dialogues multi-personnes

Introduction complète FunASR est une boîte à outils de reconnaissance vocale open-source développée par l'Alibaba Dharmo Academy pour faire le lien entre la recherche académique et les applications industrielles. Il prend en charge un large éventail de fonctions de reconnaissance vocale, notamment la reconnaissance de la parole (ASR), la détection des terminaisons vocales (VAD), la récupération de la ponctuation, la modélisation de la langue, la...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 11 mois

035.5K

AsrTools : outil de conversion de la parole en sous-titres, client léger avec interfaces intégrées pour Cutscene, Racer et Must-Cut

Introduction AsrTools est un outil de synthèse vocale intelligent avec des interfaces intégrées de grands acteurs comme Cutscene, QuickScope, MustCut, etc. Il ne nécessite pas de GPU ou de configuration encombrante, et supporte un traitement par lots efficace et multithread. Il est basé sur le développement PyQt5, une interface belle et conviviale, capable de produire des mots aux formats SRT et TXT...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 11 mois

021.4K

Happy Scribe : plateforme de transcription audio et de sous-titrage vidéo | Logiciel de sous-titrage vidéo gratuit

Happy Scribe Description générale Happy Scribe fournit des services de transcription audio automatisés et manuels pour convertir l'audio en texte avec une grande précision et la prise en charge de plusieurs langues et formats. Il comprend un éditeur interactif, des outils de collaboration, plusieurs formats d'exportation, la traduction automatique et d'autres fonctionnalités...

Dernières ressources sur l'IA # AI Speech to Text # AI éditeur audio/vidéo

Il y a 12 mois

020.3K

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop

Whisper GPGPU : OpenAI Whisper sous Windows|Whisperdesktop

Introduction générale Whisper est un projet open source GitHub développé par Const-me qui se concentre sur l'inférence haute performance du modèle de reconnaissance vocale automatique (ASR) Whisper d'OpenAI en utilisant le GPGPU. Ce projet est basé sur la licence MPL-2.0...

Dernières ressources sur l'IA # AI Speech to Text

Il y a 12 mois

027.1K

Buzz : outil de transcription audio hors ligne open source | transcription vocale IOS

Buzz Introduction générale Buzz est un projet open source créé par chidiwilliams qui permet la transcription et la traduction hors ligne de textes audio sur des ordinateurs personnels. Le projet s'appuie sur la technologie Whisper d'OpenAI, qui permet aux utilisateurs de ne pas dépendre d'une connexion Internet pour le texte audio...

Dernières ressources sur l'IA # AI Speech to Text

Il y a 12 mois

029K

Deepgram : service API pour des solutions de reconnaissance et de synthèse vocales de haute précision

Description générale Deepgram est une société spécialisée dans les technologies de reconnaissance vocale et de traitement du langage naturel, offrant de puissantes API de Speech-to-Text et Text-to-Speech....

Dernières ressources sur l'IA # AI Open Services # AI Speech to Text

Il y a 6 mois

021.6K

Murf AI : Changeur de voix|Speech to Text|Text to Speech|Audio Editor

Introduction générale Murf AI est un puissant outil de génération de voix d'intelligence artificielle en ligne qui convertit le texte en une voix humaine presque réelle. Il offre jusqu'à 120+ options de voix d'IA, supporte plus de 20 langues et convient à une variété de situations telles que les podcasts, les vidéos, les présentations professionnelles, etc.Mu...

Dernières ressources sur l'IA # Synthèse vocale AI # AI Speech to Text

Il y a 12 mois

020.5K

VideoLingo：视频转录单词级时间轴字幕，视频字幕翻译和本地化配音开源工具

VideoLingo : outils open source de transcription vidéo, de traduction de sous-titres vidéo et de doublage localisé.

Description générale VideoLingo est un outil de traduction et de localisation de vidéos conçu pour générer des sous-titres de haute qualité de type Netflix, en éliminant la traduction automatique brute et les sous-titres multilignes, et en ajoutant des voix off de haute qualité pour permettre le partage de connaissances globales au-delà des barrières linguistiques. En...

Dernières ressources sur l'IA # AI Side Hustle Money Making Project (Projet de création d'argent)# AI Traduction # AI Speech to Text

Il y a 11 mois

020.4K

ALog : application portable de journal vocal AI avec prise en charge de la synthèse vocale.

Introduction générale ALog est une application de journal vocal basée sur l'IA conçue pour aider les utilisateurs à enregistrer leur vie quotidienne par la voix. Elle est développée par duxins et en libre accès sur GitHub. Les utilisateurs peuvent enregistrer des entrées de journal par saisie vocale, et l'application convertit automatiquement la voix en texte...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 8 mois

019.3K

Record Cafe : Plate-forme unique de traitement audio/vidéo|Génération vidéo|Sous-titres IA|Extraction audio|Speech to Text

Introduction complète Record Cafe est une plateforme de traitement audio/vidéo à guichet unique, qui fournit des services de dialogue vidéo IA, de sous-titres IA et de conversion de la parole en texte IA. Les fonctions comprennent l'enregistrement d'écran, l'édition vidéo, la conversion GIF/audio, etc., et prennent en charge le stockage et le partage dans le nuage. L'interface est intuitive et facile à utiliser. Elle prend également en charge l'enregistrement multi-écrans et les...

Dernières ressources sur l'IA # AI text to video # Synthèse vocale AI # AI Speech to Text

Il y a 9 mois

019.3K

CrisperWhisper : Outil de transcription verbatim précise de la parole

Description générale CrisperWhisper est un outil de reconnaissance vocale avancé basé sur OpenAI Whisper qui se concentre sur la transcription rapide, précise et mot à mot de la parole. Il fournit des horodatages précis au niveau des mots, même avec des remplissages et des pauses...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 9 mois

022.6K

Babelfish.ai : application de transcription et de traduction de la parole en temps réel exécutée par un navigateur

Introduction générale Babelfish.ai est une application de transcription et de traduction en temps réel construite sur Huggingface Transformer.js et Supabase Realtime. L'application peut charger de grands modèles dans le navigateur et...

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

il y a 1 an

018.4K

FreeTTS : Outil de synthèse vocale en ligne gratuit|Augmentation audio|Clips audio

FreeTTS Description générale FreeTTS est un outil de synthèse vocale en ligne gratuit qui permet aux utilisateurs de convertir du texte en fichiers vocaux au son naturel. Prenant en charge plusieurs langues et options sonores, les utilisateurs peuvent convertir du texte aux formats MP3, WAV, OGG et ACC...

Dernières ressources sur l'IA # Synthèse vocale AI # AI Speech to Text # AI éditeur audio/vidéo

il y a 1 an

022.2K

Easy Voice Toolkit : kit d'outils vocaux pour un déploiement local

Introduction complète Easy-Voice-Toolkit est une boîte à outils multifonctionnelle basée sur l'Open Source Speech Project, fournissant une large gamme d'outils audio automatisés pour la reconnaissance vocale, la transcription vocale, la conversion vocale, la création d'ensembles de données et l'entraînement de modèles. Les utilisateurs peuvent utiliser ces outils de manière sélective en fonction de leurs besoins...

Dernières ressources sur l'IA # AI Java Open Source Projecct # Synthèse vocale AI # Clonage vocal AI

il y a 1 an

018.9K

DupDub : Editeur vidéo|Dubbing|Traduction vidéo|Numériseur photo alimenté par l'IA

Description générale Dupdub est une plateforme de création de podcasts et de présentations vidéo qui offre une gamme d'outils d'intelligence artificielle pour soutenir la créativité des utilisateurs. Les fonctionnalités couvrent la création de texte à la vidéo, offrant des services de doublage de voix et de vidéo par l'IA, ainsi que l'édition, la transcription et le sous-titrage de vidéos. Dupdub est également ...

Dernières ressources sur l'IA # AI Digital Man # Synthèse vocale AI # AI Speech to Text

il y a 1 an

019.3K

Tongyi Écouter et comprendre : Ali Tongyi Assistant IA de transcription de contenu audio et vidéo

Introduction complète Tongyi Listening and Understanding est un assistant IA en alternance lancé par Aliyun, qui se concentre sur la transcription et l'analyse de contenus audio et vidéo. Il s'appuie sur les puissants modèles d'IA d'AliCloud pour transcrire les contenus audio et vidéo en texte en temps réel, et propose des fonctions de traduction, de résumé, de positionnement et autres. Tongyi Listening Woo prend en charge plusieurs langues et scénarios...

Dernières ressources sur l'IA # Outil de résumé de texte AI et d'audio/vidéo # AI Speech to Text

il y a 1 an

019.8K

Insanely Fast Whisper : projet open source de transcription rapide et efficace de la parole en texte

Introduction complète insanely-fast-whisper est un transfert audio qui combine le modèle Whisper d'OpenAI avec diverses techniques d'optimisation (par exemple Transformers, Optimum, Flash Attention)....

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 8 mois

019.2K

Memo AI : client natif pour le sous-titrage de vidéos, conversion de sous-titres multilingues

Description générale MemoAI est un puissant outil de traduction vidéo conçu pour convertir des fichiers vidéo et audio en texte, sous-titres et notes. Qu'il s'agisse d'une vidéo YouTube, d'un podcast ou d'un fichier local, MemoAI peut le gérer facilement. Il prend en charge plus de 90 langues telles que le chinois, l'anglais, le japonais...

Dernières ressources sur l'IA # Synthèse vocale AI # AI Speech to Text # AI éditeur audio/vidéo

Il y a 10 mois

021.1K

pyvideotrans : Outil de doublage pour la traduction de vidéos

pyVideoTrans Introduction générale pyvideotrans est un outil de traduction et de doublage de vidéos. Les utilisateurs peuvent traduire le contenu d'une vidéo d'une langue à une autre, et ajouter les doublages et sous-titres appropriés à la vidéo. Il est basé sur openai-whisper offline...

Dernières ressources sur l'IA # Synthèse vocale AI # AI Speech to Text # AI éditeur audio/vidéo

il y a 1 an

022.3K

Ce n'est pas le cas.