🚀邀请体验：中国首家 AI IDE 智能编程软件 Trae 中文版下载，不限量使用 DeepSeek-R1 和 Doubao-pro!

共 53 篇文章

标签：AI语音转文本第2页

Orate：集成知名语音生成、语音转录与变声模型的统一API

综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API，能够与领先的AI提供商（如OpenAI、ElevenLabs和AssemblyAI）无缝集成，帮助用户创建逼真、类人语音并将音频转录为文本。Ora...

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

综合介绍 PengChengStarling（鹏城实验室）是一个多语言自动语音识别（ASR）工具，能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发，提供了完整的语音识别流程，包括数据处理、模型训练、...

2025-01-30AI工具 AI开源项目 AI语音转文本

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

开启 Builder 智能编程模式，无限量使用 DeepSeek-R1 和 DeepSeek-V3 ，对比海外版体验更加流畅。只需输入中文指令，不懂编程的小白也可以零门槛编写自己的应用。

2025-04-26

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

综合介绍 RealtimeSTT 是一个高效、低延迟的实时语音转文字库，具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发，旨在为需要快速、准确语音转文字的应用提供支持。无论是语音助手还是需要精...

2025-01-18AI新闻 AI开源项目 AI语音转文本

Sherpa-ONNX：使用ONNXRuntime实现离线语音识别和合成

综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目，旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台，包括 Android、iOS、Raspberry Pi 等，能够在没有网络连接的情况下进行实时...

2025-01-16AI工具 AI开源项目 AI文本转语音 AI语音转文本

Acoust：在线AI语音生成和文本转语音（TTS）服务平台

综合介绍 Acoust 是一个在线 AI 语音生成和文本转语音（TTS）服务平台，利用最新的 AI 技术生成逼真的语音。该平台还提供强大的视频编辑工具，使用户无需使用多种软件即可完成视频制作。Acoust 支持超过 30 种语...

2025-01-10AI工具 AI文本转语音 AI语音转文本

Notta：AI会议记录与音频转录工具，自动转录会议、采访或录音

综合介绍 Notta是一款功能强大的AI会议记录与音频转录工具，旨在帮助用户自动将会议、采访或录音转化为可搜索的文本。通过Notta，用户可以轻松地转录、编辑、总结和协作，提升工作效率。Notta支持58种语言的转录...

2025-01-09AI工具 AI文本与音频/视频总结工具 AI语音转文本

AI no jimaku gumi：借助AI实现视频多语言字幕自动生成和翻译

综合介绍 AI no jimaku gumi（AI の字幕組）是一个强大的命令行视频字幕处理工具，专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术，包括 Whisper 语音识别模型和多种翻译后端（如Dee...

2025-01-06AI工具 AI开源项目 AI翻译 AI语音转文本

FunClip：智能剪辑视频内容为短片，轻松实现精准视频片段提取/裁剪

综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具，由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型，可以准确识别视频中的语音内容并转换为文字。特别之处...

2025-01-03AI工具 AI开源项目 AI语音转文本 AI音视频编辑

BetterWhisperX：自动语音识别与说话人分离，提供高精度单词级时间戳

综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本，专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支，该项目由 Federico Torrielli 维护，致力于保持项目的持续更新和性能提...

2024-12-29AI工具 AI开源项目 AI语音转文本

Freed：AI医疗抄写助手，准确转录医生和患者对话，减少就诊记录文书工作

综合介绍 Freed 是一款专为医疗专业人士设计的 AI 医疗抄写助手。它通过先进的人工智能技术，帮助医生和其他医疗从业者自动记录患者的就诊信息，减少文书工作，提高工作效率。Freed 的 AI 抄写助手能够实时聆听、...

2024-12-27AI工具 AI语音转文本

Voicenotes：AI语音笔记，记录与转录语音，智能管理会议内容

综合介绍 Voicenotes 是一款智能语音笔记应用，旨在帮助用户轻松记录和管理语音笔记及会议内容。该应用支持100多种语言的语音转录，用户只需说出想法，Voicenotes 即可自动将其转录为文字。无论是学生、专业人士...

2024-12-25AI工具 AI笔记 AI语音转文本

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具，支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Whisper 和 Whisper-Timestamped 等技术，提供高效的...

2024-11-24AI工具 AI开源项目 AI翻译 AI语音转文本

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换

综合介绍 Zamzar 是一个功能强大的在线文件转换工具，支持超过 1200 种文件格式的转换。无论是文档、图片、视频、音频还是电子书，Zamzar 都能快速高效地完成转换任务。用户无需下载任何软件，只需在网页上选择文...

2024-11-04AI工具 AI开放服务 AI语音转文本

AI Hear：本地离线运行的实时语音转录与翻译软件

综合介绍如果你在用 MacBook，试试 AI Hear：可以录音、实时本地语音转文字、并翻译、最终导出字幕。可以用它辅助你听跨国会议、英文有声书。 AI Hear是一款本地运行的软件，提供一键实时翻译和转录功能，支持多...

2024-11-03AI工具 AI翻译 AI语音转文本

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

综合介绍 SoniTranslate 是一个强大且用户友好的视频多语言配音工具，旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术，将视频内容翻译成多种语言，并保持音频同步。该项目基于 Gradi...

2024-10-27AI工具 AI文本转语音 AI翻译 AI语音转文本

FunASR：开源语音识别工具包，说话人分离/ 多人对话语音识别

综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包，旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能，包括语音识别（ASR）、语音端点检测（VAD）、标点恢复、语言模型、说话人验证、说...

2024-10-16AI工具 AI开源项目 AI语音转文本

AsrTools：语音转字幕工具，内置剪映、快手、必剪接口的轻量客户端

综合介绍 AsrTools是一款智能语音转文字工具，内置剪映、快手、必剪等大厂接口，无需GPU或繁琐配置，支持高效的多线程批处理。它基于PyQt5开发，界面美观且用户友好，能够输出SRT和TXT格式字幕文件。该工具通过调...

2024-10-14AI工具 AI开源项目 AI语音转文本

Happy Scribe：音频转录和视频字幕平台|免费视频字幕编辑软件

Happy Scribe 综合介绍 Happy Scribe提供自动和人工的音频转写服务，以高准确率将音频转换为文字，并支持多种语言和格式。它包含互动式编辑器、协作工具、多种导出格式、机器翻译等功能。该平台安全可靠，...

2024-10-09AI工具 AI语音转文本 AI音视频编辑

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop

综合介绍 Whisper是由Const-me开发的一个GitHub开源项目，专注于使用GPGPU实现OpenAI的Whisper自动语音识别（ASR）模型的高性能推断。这个项目是基于MPL-2.0许可证发布的，最新版本1.12发布于2023年7月22日。在代...

2024-10-09AI工具 AI语音转文本

上一页
1
2
3
下一页
共 3 页

标签：AI语音转文本第2页

Orate：集成知名语音生成、语音转录与变声模型的统一API

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

Sherpa-ONNX：使用ONNXRuntime实现离线语音识别和合成

Acoust：在线AI语音生成和文本转语音（TTS）服务平台

Notta：AI会议记录与音频转录工具，自动转录会议、采访或录音

AI no jimaku gumi：借助AI实现视频多语言字幕自动生成和翻译

FunClip：智能剪辑视频内容为短片，轻松实现精准视频片段提取/裁剪

BetterWhisperX：自动语音识别与说话人分离，提供高精度单词级时间戳

Freed：AI医疗抄写助手，准确转录医生和患者对话，减少就诊记录文书工作

Voicenotes：AI语音笔记，记录与转录语音，智能管理会议内容

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换

AI Hear：本地离线运行的实时语音转录与翻译软件

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

FunASR：开源语音识别工具包，说话人分离/ 多人对话语音识别

AsrTools：语音转字幕工具，内置剪映、快手、必剪接口的轻量客户端

Happy Scribe：音频转录和视频字幕平台|免费视频字幕编辑软件

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop

找不到AI工具？在这试试！

FLUX.1图像生成器（支持中文输入）

近期AI热点

AI工具推荐

AI工具分类

标签：AI语音转文本 第2页

找不到AI工具？在这试试！

FLUX.1图像生成器（支持中文输入）

近期AI热点

AI工具推荐

AI工具分类

标签：AI语音转文本第2页