
Buzz:开源离线音频转写翻译工具|IOS语音转录
Buzz 综合介绍 Buzz是一个由chidiwilliams创建的开源项目,它能够在个人电脑上离线转录和翻译音频。该项目依托于OpenAI的Whisper技术,使得用户可以不依赖互联网连接进行音频文件的转写和翻译工作。通过GitHub,...
Buzz 综合介绍 Buzz是一个由chidiwilliams创建的开源项目,它能够在个人电脑上离线转录和翻译音频。该项目依托于OpenAI的Whisper技术,使得用户可以不依赖互联网连接进行音频文件的转写和翻译工作。通过GitHub,...
综合介绍 Deepgram是一家专注于语音识别和自然语言处理技术的公司,提供强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API。该平台利用先进的人工智能技术,帮助开发者将语音转录和理解功能...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Murf AI是一个强大的在线人工智能语音生成工具,能够将文本转换成近似真人的语音。它提供多达120种以上的AI语音选项,支持20种以上语言,适合各种场合使用,如播客、视频、专业演示等。Murf AI还具备音...
综合介绍 VideoLingo 是一个一站式视频翻译和本地化配音工具,旨在生成 Netflix 级别的高质量字幕,消除生硬的机器翻译和多行字幕,并添加高质量的配音,使全球知识能够跨越语言障碍共享。通过直观的 Streamlit ...
综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文字,并进行智能分析...
综合介绍 录咖是一站式音视频处理平台,提供AI视频对话、AI字幕和AI语音转文字服务。功能包括录制屏幕、剪辑视频、转换GIF/音频等,并支持云存储与分享。界面直观,使用方便,还支持多屏幕录制和多语种智能朗读,...
综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具,专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳,甚至在语音填充和停顿的情况下也能准确记录。CrisperWhisper 通过调...
综合介绍 Babelfish.ai 是一个基于 Huggingface Transformer.js 和 Supabase Realtime 构建的实时转录和翻译应用。该应用可以在浏览器中加载大模型并在本地运行,实现实时的语音转文字和翻译功能。用户可以通过简...
FreeTTS 综合介绍 FreeTTS 是一个免费的在线文本转语音工具,用户可以将文本转换为自然声音的语音文件。支持多种语言和声音选择,用户可以将文本转换为 MP3、WAV、OGG 和 ACC 格式。FreeTTS 还提供语音转录、声音...
综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具,或按顺序使用它们...
综合介绍 Dupdub是侧重播客和视频演示文稿创作平台,提供一系列AI工具来支持用户的创造力。功能覆盖从文本到视频的创作,提供人工智能语音和视频配音服务,以及视频编辑、转录和字幕制作。 Dupdub又出门问问推出...
综合介绍 通义听悟是阿里云推出的一款工作学习AI助手,专注于音视频内容的转写和分析。它依托阿里云的强大AI模型,能够将音视频内容实时转写成文字,并提供翻译、总结、定位等功能。通义听悟支持多种语言和场景,...
综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术(如Transformers, Optimum, Flash Attention)的音频转录工具,提供了命令行界面(CLI),旨在快速高效地转录大量音频。它使用Whi...
综合介绍 MemoAI是一款功能强大的视频翻译工具,专门用于将视频和音频文件转换为文本、字幕和笔记。不论是YouTube视频、播客还是本地文件,MemoAI都能轻松处理。支持中、英、日等90多种语言的转录与翻译。MemoAI...
pyVideoTrans 综合介绍 pyvideotrans是一个视频翻译配音工具。用户能够将视频内容从一种语言翻译成另一种语言,并在视频中添加相应的配音和字幕。它基于openai-whisper离线模型,支持多种翻译和语音合成服务,例...