Abogen:将多种文本格式转换为有声读物的工具综合介绍 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物...最新AI资源# AI开源项目# AI语音转文本3个月前01.2K
Kimi-Audio:开源音频处理与对话基础模型综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型,专注于音频理解、生成和对话。它支持多种音频处理任务,例如语音识别、音频问答和语音情感识别。模型经过超过 130...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本3个月前01.3K
On Device AI:iPhone本地运行的AI语音转录与聊天工具综合介绍 On-Device AI 是一款完全离线运行的AI应用,专为苹果设备设计,支持iOS、macOS和visionOS。它提供本地大型语言模型(LLM)运行、实时语音转录、文档分析等功能,无需联...最新AI资源# AI本地化聊天应用# AI语音转文本3个月前01.3K
Vexa:实时会议转录与智能知识提取工具综合介绍 Vexa 是一个开源的实时会议转录和知识管理平台,旨在为企业和个人提供高效的会议记录与智能知识提取服务。它通过 API 驱动的会议机器人,自动加入 Google Meet、Zoom 等平台...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI语音转文本4个月前01.2K
实时语音转文字的开源工具综合介绍 realtime-transcription-fastrtc 是一个开源项目,专注于将语音实时转换为文字。它利用 FastRTC 技术处理低延迟音频流,结合本地 Whisper 模型实现高效...最新AI资源# AI开源项目# AI语音转文本4个月前01.5K
Transkriptor:将音频和视频转为文字的AI智能转录工具综合介绍 Transkriptor 是一个人工智能驱动的转录工具,专注于将音频和视频快速转为文字。它支持超过100种语言,准确率高达99%,适用于会议、采访、课堂笔记等多种场景。用户可以上传文件、直接...最新AI资源# AI文本与音频/视频总结工具# AI翻译# AI语音转文本4个月前01.5K
Otter.ai:智能会议助手与实时语音转录工具综合介绍 Otter.ai 是一个人工智能驱动的会议管理与语音转录工具,核心功能是将语音实时转为文字,并自动生成会议笔记、摘要和行动项。它通过 AI Meeting Agent 提供智能支持,能自动加...最新AI资源# AI文本与音频/视频总结工具# AI语音转文本4个月前01.2K
TurboScribe:快速将音频和视频转为文字的在线工具综合介绍 TurboScribe 是一个基于人工智能的转录工具,专注于将音频和视频快速转为文字。它支持超过98种语言,准确率高达99.8%,适合需要高效处理语音内容的用户。用户可以上传文件,生成文字记...最新AI资源# AI语音转文本4个月前01.3K
Aqua Voice:跨应用语音输入生成精准文本综合介绍 Aqua Voice 是一个基于语音的智能文本生成工具,专注于将用户语音快速转化为格式化文本。它由 Finnian Brown 和 Jack McIntire 创建于2023年,总部位于美国...最新AI资源# AI语音转文本4个月前01.9K
Dolphin:面向亚洲语言识别与语音转文本模型综合介绍 Dolphin 是由 DataoceanAI 和清华大学合作开发的一个开源模型,专注于亚洲语言的语音识别和语言识别。它支持东亚、南亚、东南亚及中东地区的 40 种语言,以及 22 种中国方言...最新AI资源# AI开源项目# AI语音转文本4个月前01.2K
TwinMind:免费离线语音转录文字的APP综合介绍 TwinMind 是由 ThirdEar AI, Inc. 开发的一款智能工具,主打“帮你记住一切”。它能把对话、会议或讲座实时录下来并转成文字,支持 100 多种语言,哪怕手机放口袋里也能...最新AI资源# AI文本与音频/视频总结工具# AI语音转文本4个月前01.3K
Wispr Flow:用语音在任何应用中快速输入文字综合介绍 Wispr Flow 是一个通过语音输入文字的工具,帮助用户在电脑上快速写作。它主打“3倍于打字速度”的体验,用户只需自然说话,就能将文字输入到任何应用中,比如 Word、Slack 或 G...最新AI资源# AI语音转文本2个月前01.3K
Meeting:本地实时转录和生成会议纪要的开源客户端综合介绍 Meeting Minutes(又名 Meetily)是由 Zackriya Solutions 开发的一款免费开源的 AI 会议助手工具,专注于实时捕获会议音频、生成转录文本并自动提取会议...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI语音转文本5个月前01.4K
Local-NotebookLM:本地PDF生成语音播客的开源工具综合介绍 Local-NotebookLM 是一个开源项目,旨在提供本地运行的智能文档处理与内容生成工具。它受到 Google NotebookLM 的启发,专注于帮助用户将 PDF 等文档转化为多种...最新AI资源# AI开源项目# AI语音转文本5个月前01.2K
AssemblyAI:高精度语音转文字与音频智能分析平台综合介绍 AssemblyAI 是一个专注于语音AI技术的平台,为开发者和企业提供高效的语音转文字和音频分析工具。其核心亮点在于 Universal 系列模型,尤其是最新发布的 Universal-2...最新AI资源# AI开放服务# AI语音转文本5个月前01.5K
FireRedASR:多语言高精度语音识别开源模型综合介绍 FireRedASR 是由小红书 FireRed 团队开发并开源的语音识别模型,专注于提供高精度、多语言支持的自动语音识别(ASR)解决方案。项目托管于 GitHub,面向开发者与研究者,提...最新AI资源# AI开源项目# AI语音转文本5个月前01.5K
WhisperChain:实时语音转文字并优化口语化词语综合介绍 WhisperChain 是一个基于人工智能的开源项目,托管在 GitHub 上,由开发者 Chris Choy 主导开发。它主要用于将语音转化为文字,并通过 AI 技术自动优化表达,去除冗...最新AI资源# AI开源项目# AI语音转文本5个月前01.4K
LLPlayer:生成实时字幕并双语翻译的视频播放器综合介绍 LLPlayer 是一款专为语言学习者设计的开源媒体播放器,托管于 GitHub,由开发者 umlx5h 创建。它集成了多种实用功能,如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等...最新AI资源# AI开源项目# AI翻译# AI语音转文本2个月前02.6K
CapsWriter-Offline:PC端的语音输入和字幕转录工具综合介绍 CapsWriter-Offline 是一个专注于PC端的语音输入和字幕转录工具,托管于 GitHub,由开发者 HaujetZhao 打造。它完全离线运行,无需联网即可实现语音转文字和音视...最新AI资源# AI开源项目# AI语音转文本6个月前01.7K
Whisper Input:利用Groq免费且高速的语音转录文本服务综合介绍 Whisper Input 是一个开源的语音转译工具,用户可以通过按下 Option 按钮开始录制语音,抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo ...最新AI资源# AI开源项目# AI语音转文本6个月前01.6K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言综合介绍 LiberSonora,寓意“自由的声音”,是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能,能够在GPU加速下进行批量离线处理。LiberSo...最新AI资源# AI开源项目# AI翻译# AI语音转文本6个月前01.5K
AudioNotes:快速提取音视频内容并生成结构化笔记综合介绍 AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统。它能够快速提取音视频内容,并调用大模型进行整理,生成一份结构化的 Markdown 笔记,方便用...最新AI资源# AI开源项目# AI语音转文本6个月前01.5K
Orate:集成知名语音生成、语音转录与变声模型的统一API综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本6个月前01.9K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具综合介绍 PengChengStarling(鹏城实验室)是一个多语言自动语音识别(ASR)工具,能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发,提供了完整的语音识别流程...最新AI资源# AI开源项目# AI语音转文本6个月前01.5K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别综合介绍 RealtimeSTT 是一个高效、低延迟的实时语音转文字库,具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发,旨在为需要快速、准确语音转文字的应用提供支持...AI新闻# AI开源项目# AI语音转文本7个月前01.9K
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目,旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台,包括 Android、iOS、Raspber...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本7个月前03.3K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台综合介绍 Acoust 是一个在线 AI 语音生成和文本转语音(TTS)服务平台,利用最新的 AI 技术生成逼真的语音。该平台还提供强大的视频编辑工具,使用户无需使用多种软件即可完成视频制作。Acou...最新AI资源# AI文本转语音# AI语音转文本7个月前01.7K
Notta:AI会议记录与音频转录工具,自动转录会议、采访或录音综合介绍 Notta是一款功能强大的AI会议记录与音频转录工具,旨在帮助用户自动将会议、采访或录音转化为可搜索的文本。通过Notta,用户可以轻松地转录、编辑、总结和协作,提升工作效率。Notta支持...最新AI资源# AI文本与音频/视频总结工具# AI语音转文本7个月前02.2K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI资源# AI开源项目# AI翻译# AI语音转文本7个月前01.7K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语...最新AI资源# AI开源项目# AI语音转文本# AI音视频编辑7个月前02.3K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico ...最新AI资源# AI开源项目# AI语音转文本7个月前02.1K
Freed:AI医疗抄写助手,准确转录医生和患者对话,减少就诊记录文书工作综合介绍 Freed 是一款专为医疗专业人士设计的 AI 医疗抄写助手。它通过先进的人工智能技术,帮助医生和其他医疗从业者自动记录患者的就诊信息,减少文书工作,提高工作效率。Freed 的 AI 抄写...最新AI资源# AI语音转文本8个月前02.1K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容综合介绍 Voicenotes 是一款智能语音笔记应用,旨在帮助用户轻松记录和管理语音笔记及会议内容。该应用支持100多种语言的语音转录,用户只需说出想法,Voicenotes 即可自动将其转录为文字...最新AI资源# AI笔记# AI语音转文本8个月前02K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Wh...最新AI资源# AI开源项目# AI翻译# AI语音转文本9个月前02.3K
Zamzar:多功能在线文件格式转换工具,视频转换|音频转换|图片转换|文档转换综合介绍 Zamzar 是一个功能强大的在线文件转换工具,支持超过 1200 种文件格式的转换。无论是文档、图片、视频、音频还是电子书,Zamzar 都能快速高效地完成转换任务。用户无需下载任何软件...最新AI资源# AI开放服务# AI语音转文本9个月前03.4K
AI Hear:本地离线运行的实时语音转录与翻译软件综合介绍 如果你在用 MacBook,试试 AI Hear:可以录音、实时本地语音转文字、并翻译、最终导出字幕。可以用它辅助你听跨国会议、英文有声书。 AI Hear是一款本地运行的软件,提供一键实时...最新AI资源# AI翻译# AI语音转文本9个月前02.1K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声综合介绍 SoniTranslate 是一个强大且用户友好的视频多语言配音工具,旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术,将视频内容翻译成多种语言,并保持音频同步。该项...最新AI资源# AI文本转语音# AI翻译# AI语音转文本10个月前04K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包,旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话...最新AI资源# AI开源项目# AI语音转文本10个月前02.8K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端综合介绍 AsrTools是一款智能语音转文字工具,内置剪映、快手、必剪等大厂接口,无需GPU或繁琐配置,支持高效的多线程批处理。它基于PyQt5开发,界面美观且用户友好,能够输出SRT和TXT格式字...最新AI资源# AI开源项目# AI语音转文本10个月前02.8K
Happy Scribe:音频转录和视频字幕平台|免费视频字幕编辑软件Happy Scribe 综合介绍 Happy Scribe提供自动和人工的音频转写服务,以高准确率将音频转换为文字,并支持多种语言和格式。它包含互动式编辑器、协作工具、多种导出格式、机器翻译等功...最新AI资源# AI语音转文本# AI音视频编辑10个月前02.3K
Whisper GPGPU:运行在Windows的OpenAI Whisper|Whisperdesktop综合介绍 Whisper是由Const-me开发的一个GitHub开源项目,专注于使用GPGPU实现OpenAI的Whisper自动语音识别(ASR)模型的高性能推断。这个项目是基于MPL-2.0许可...最新AI资源# AI语音转文本10个月前02.2K
Buzz:开源离线音频转写翻译工具|IOS语音转录Buzz 综合介绍 Buzz是一个由chidiwilliams创建的开源项目,它能够在个人电脑上离线转录和翻译音频。该项目依托于OpenAI的Whisper技术,使得用户可以不依赖互联网连接进行音频文...最新AI资源# AI语音转文本10个月前02.5K
Deepgram:高精度语音识别和合成解决方案服务API综合介绍 Deepgram是一家专注于语音识别和自然语言处理技术的公司,提供强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API。该平台利用先进的人工智能...最新AI资源# AI开放服务# AI语音转文本5个月前01.9K
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器综合介绍 Murf AI是一个强大的在线人工智能语音生成工具,能够将文本转换成近似真人的语音。它提供多达120种以上的AI语音选项,支持20种以上语言,适合各种场合使用,如播客、视频、专业演示等。Mu...最新AI资源# AI文本转语音# AI语音转文本10个月前02.6K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具综合介绍 VideoLingo 是一个一站式视频翻译和本地化配音工具,旨在生成 Netflix 级别的高质量字幕,消除生硬的机器翻译和多行字幕,并添加高质量的配音,使全球知识能够跨越语言障碍共享。通过...最新AI资源# AI副业赚钱项目# AI翻译# AI语音转文本10个月前02.1K
ALog:便携AI语音日记应用,支持语音转文字。综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文...最新AI资源# AI开源项目# AI语音转文本7个月前02.4K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字综合介绍 录咖是一站式音视频处理平台,提供AI视频对话、AI字幕和AI语音转文字服务。功能包括录制屏幕、剪辑视频、转换GIF/音频等,并支持云存储与分享。界面直观,使用方便,还支持多屏幕录制和多语种智...最新AI资源# AI文本转视频# AI文本转语音# AI语音转文本8个月前02.2K
CrisperWhisper:精确的逐字语音转录工具综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具,专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳,甚至在语音填充和停顿的情况下也能准...最新AI资源# AI开源项目# AI语音转文本7个月前03K
Babelfish.ai:浏览器运行的语音实时转录与翻译应用综合介绍 Babelfish.ai 是一个基于 Huggingface Transformer.js 和 Supabase Realtime 构建的实时转录和翻译应用。该应用可以在浏览器中加载大模型并...最新AI资源# AI开源项目# AI语音转文本11个月前01.8K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑FreeTTS 综合介绍 FreeTTS 是一个免费的在线文本转语音工具,用户可以将文本转换为自然声音的语音文件。支持多种语言和声音选择,用户可以将文本转换为 MP3、WAV、OGG 和 ACC 格式...最新AI资源# AI文本转语音# AI语音转文本# AI音视频编辑11个月前02.9K
Easy Voice Toolkit:本地部署的AI语音工具箱综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆11个月前02.2K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人综合介绍 Dupdub是侧重播客和视频演示文稿创作平台,提供一系列AI工具来支持用户的创造力。功能覆盖从文本到视频的创作,提供人工智能语音和视频配音服务,以及视频编辑、转录和字幕制作。 Dupdub又...最新AI资源# AI数字人# AI文本转语音# AI语音转文本12个月前01.8K
通义听悟:阿里通义音视频内容转录AI助手综合介绍 通义听悟是阿里云推出的一款工作学习AI助手,专注于音视频内容的转写和分析。它依托阿里云的强大AI模型,能够将音视频内容实时转写成文字,并提供翻译、总结、定位等功能。通义听悟支持多种语言和场景...最新AI资源# AI文本与音频/视频总结工具# AI语音转文本11个月前02K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术(如Transformers, Optimum, Flash Attention)的音频转...最新AI资源# AI开源项目# AI语音转文本7个月前02.4K
Memo AI:视频转字幕、转换多语言字幕的本地客户端综合介绍 MemoAI是一款功能强大的视频翻译工具,专门用于将视频和音频文件转换为文本、字幕和笔记。不论是YouTube视频、播客还是本地文件,MemoAI都能轻松处理。支持中、英、日等90多种语言的...最新AI资源# AI文本转语音# AI语音转文本# AI音视频编辑8个月前02.5K
pyvideotrans:视频翻译配音工具pyVideoTrans 综合介绍 pyvideotrans是一个视频翻译配音工具。用户能够将视频内容从一种语言翻译成另一种语言,并在视频中添加相应的配音和字幕。它基于openai-whisper离线...最新AI资源# AI文本转语音# AI语音转文本# AI音视频编辑1年前02.3K