
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳
综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico Torrielli 维护,致力于保持项目的持续更新和性能提...
综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico Torrielli 维护,致力于保持项目的持续更新和性能提...
综合介绍 Freed 是一款专为医疗专业人士设计的 AI 医疗抄写助手。它通过先进的人工智能技术,帮助医生和其他医疗从业者自动记录患者的就诊信息,减少文书工作,提高工作效率。Freed 的 AI 抄写助手能够实时聆听、...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Voicenotes 是一款智能语音笔记应用,旨在帮助用户轻松记录和管理语音笔记及会议内容。该应用支持100多种语言的语音转录,用户只需说出想法,Voicenotes 即可自动将其转录为文字。无论是学生、专业人士...
综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Whisper 和 Whisper-Timestamped 等技术,提供高效的...
综合介绍 Zamzar 是一个功能强大的在线文件转换工具,支持超过 1200 种文件格式的转换。无论是文档、图片、视频、音频还是电子书,Zamzar 都能快速高效地完成转换任务。用户无需下载任何软件,只需在网页上选择文...
综合介绍 如果你在用 MacBook,试试 AI Hear:可以录音、实时本地语音转文字、并翻译、最终导出字幕。可以用它辅助你听跨国会议、英文有声书。 AI Hear是一款本地运行的软件,提供一键实时翻译和转录功能,支持多...
综合介绍 SoniTranslate 是一个强大且用户友好的视频多语言配音工具,旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术,将视频内容翻译成多种语言,并保持音频同步。该项目基于 Gradi...
综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包,旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说...
综合介绍 AsrTools是一款智能语音转文字工具,内置剪映、快手、必剪等大厂接口,无需GPU或繁琐配置,支持高效的多线程批处理。它基于PyQt5开发,界面美观且用户友好,能够输出SRT和TXT格式字幕文件。该工具通过调...
Happy Scribe 综合介绍 Happy Scribe提供自动和人工的音频转写服务,以高准确率将音频转换为文字,并支持多种语言和格式。它包含互动式编辑器、协作工具、多种导出格式、机器翻译等功能。该平台安全可靠,...
综合介绍 Whisper是由Const-me开发的一个GitHub开源项目,专注于使用GPGPU实现OpenAI的Whisper自动语音识别(ASR)模型的高性能推断。这个项目是基于MPL-2.0许可证发布的,最新版本1.12发布于2023年7月22日。在代...
Buzz 综合介绍 Buzz是一个由chidiwilliams创建的开源项目,它能够在个人电脑上离线转录和翻译音频。该项目依托于OpenAI的Whisper技术,使得用户可以不依赖互联网连接进行音频文件的转写和翻译工作。通过GitHub,...
综合介绍 Deepgram是一家专注于语音识别和自然语言处理技术的公司,提供强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API。该平台利用先进的人工智能技术,帮助开发者将语音转录和理解功能...
综合介绍 Murf AI是一个强大的在线人工智能语音生成工具,能够将文本转换成近似真人的语音。它提供多达120种以上的AI语音选项,支持20种以上语言,适合各种场合使用,如播客、视频、专业演示等。Murf AI还具备音...
综合介绍 VideoLingo 是一个一站式视频翻译和本地化配音工具,旨在生成 Netflix 级别的高质量字幕,消除生硬的机器翻译和多行字幕,并添加高质量的配音,使全球知识能够跨越语言障碍共享。通过直观的 Streamlit ...
综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文字,并进行智能分析...
综合介绍 录咖是一站式音视频处理平台,提供AI视频对话、AI字幕和AI语音转文字服务。功能包括录制屏幕、剪辑视频、转换GIF/音频等,并支持云存储与分享。界面直观,使用方便,还支持多屏幕录制和多语种智能朗读,...
综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具,专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳,甚至在语音填充和停顿的情况下也能准确记录。CrisperWhisper 通过调...
综合介绍 Babelfish.ai 是一个基于 Huggingface Transformer.js 和 Supabase Realtime 构建的实时转录和翻译应用。该应用可以在浏览器中加载大模型并在本地运行,实现实时的语音转文字和翻译功能。用户可以通过简...