AI语音转文本

共 56 篇文章

排序

浏览收藏

Abogen：将多种文本格式转换为有声读物的工具

综合介绍 Abogen 是一个开源工具，专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音，同时支持同步字幕生成，适合制作有声读物...

最新AI资源 # AI开源项目 # AI语音转文本

11个月前

076.3K

Kimi-Audio：开源音频处理与对话基础模型

综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型，专注于音频理解、生成和对话。它支持多种音频处理任务，例如语音识别、音频问答和语音情感识别。模型经过超过 130...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

11个月前

0119.4K

On Device AI：iPhone本地运行的AI语音转录与聊天工具

综合介绍 On-Device AI 是一款完全离线运行的AI应用，专为苹果设备设计，支持iOS、macOS和visionOS。它提供本地大型语言模型（LLM）运行、实时语音转录、文档分析等功能，无需联...

最新AI资源 # AI本地化聊天应用 # AI语音转文本

11个月前

073.5K

Vexa：实时会议转录与智能知识提取工具

综合介绍 Vexa 是一个开源的实时会议转录和知识管理平台，旨在为企业和个人提供高效的会议记录与智能知识提取服务。它通过 API 驱动的会议机器人，自动加入 Google Meet、Zoom 等平台...

12个月前

0102K

实时语音转文字的开源工具

综合介绍 realtime-transcription-fastrtc 是一个开源项目，专注于将语音实时转换为文字。它利用 FastRTC 技术处理低延迟音频流，结合本地 Whisper 模型实现高效...

最新AI资源 # AI开源项目 # AI语音转文本

12个月前

066K

Transkriptor：将音频和视频转为文字的AI智能转录工具

综合介绍 Transkriptor 是一个人工智能驱动的转录工具，专注于将音频和视频快速转为文字。它支持超过100种语言，准确率高达99%，适用于会议、采访、课堂笔记等多种场景。用户可以上传文件、直接...

12个月前

077.3K

Otter.ai：智能会议助手与实时语音转录工具

综合介绍 Otter.ai 是一个人工智能驱动的会议管理与语音转录工具，核心功能是将语音实时转为文字，并自动生成会议笔记、摘要和行动项。它通过 AI Meeting Agent 提供智能支持，能自动加...

最新AI资源 # AI文本与音频/视频总结工具 # AI语音转文本

12个月前

067K

TurboScribe：快速将音频和视频转为文字的在线工具

综合介绍 TurboScribe 是一个基于人工智能的转录工具，专注于将音频和视频快速转为文字。它支持超过98种语言，准确率高达99.8%，适合需要高效处理语音内容的用户。用户可以上传文件，生成文字记...

最新AI资源 # AI语音转文本

12个月前

085.9K

Aqua Voice：跨应用语音输入生成精准文本

综合介绍 Aqua Voice 是一个基于语音的智能文本生成工具，专注于将用户语音快速转化为格式化文本。它由 Finnian Brown 和 Jack McIntire 创建于2023年，总部位于美国...

最新AI资源 # AI语音转文本

12个月前

0176.3K

Dolphin：面向亚洲语言识别与语音转文本模型

综合介绍 Dolphin 是由 DataoceanAI 和清华大学合作开发的一个开源模型，专注于亚洲语言的语音识别和语言识别。它支持东亚、南亚、东南亚及中东地区的 40 种语言，以及 22 种中国方言...

最新AI资源 # AI开源项目 # AI语音转文本

12个月前

061K

TwinMind：免费离线语音转录文字的APP

综合介绍 TwinMind 是由 ThirdEar AI, Inc. 开发的一款智能工具，主打“帮你记住一切”。它能把对话、会议或讲座实时录下来并转成文字，支持 100 多种语言，哪怕手机放口袋里也能...

最新AI资源 # AI文本与音频/视频总结工具 # AI语音转文本

1年前

058.9K

Wispr Flow：用语音在任何应用中快速输入文字

综合介绍 Wispr Flow 是一个通过语音输入文字的工具，帮助用户在电脑上快速写作。它主打“3倍于打字速度”的体验，用户只需自然说话，就能将文字输入到任何应用中，比如 Word、Slack 或 G...

最新AI资源 # AI语音转文本

10个月前

0125.2K

Meeting：本地实时转录和生成会议纪要的开源客户端

综合介绍 Meeting Minutes（又名 Meetily）是由 Zackriya Solutions 开发的一款免费开源的 AI 会议助手工具，专注于实时捕获会议音频、生成转录文本并自动提取会议...

1年前

0103.8K

Local-NotebookLM：本地PDF生成语音播客的开源工具

综合介绍 Local-NotebookLM 是一个开源项目，旨在提供本地运行的智能文档处理与内容生成工具。它受到 Google NotebookLM 的启发，专注于帮助用户将 PDF 等文档转化为多种...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

085.8K

AssemblyAI：高精度语音转文字与音频智能分析平台

综合介绍 AssemblyAI 是一个专注于语音AI技术的平台，为开发者和企业提供高效的语音转文字和音频分析工具。其核心亮点在于 Universal 系列模型，尤其是最新发布的 Universal-2...

最新AI资源 # AI开放服务 # AI语音转文本

1年前

069K

FireRedASR：多语言高精度语音识别开源模型

综合介绍 FireRedASR 是由小红书 FireRed 团队开发并开源的语音识别模型，专注于提供高精度、多语言支持的自动语音识别（ASR）解决方案。项目托管于 GitHub，面向开发者与研究者，提...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

098.8K

WhisperChain：实时语音转文字并优化口语化词语

综合介绍 WhisperChain 是一个基于人工智能的开源项目，托管在 GitHub 上，由开发者 Chris Choy 主导开发。它主要用于将语音转化为文字，并通过 AI 技术自动优化表达，去除冗...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

055.7K

LLPlayer：生成实时字幕并双语翻译的视频播放器

综合介绍 LLPlayer 是一款专为语言学习者设计的开源媒体播放器，托管于 GitHub，由开发者 umlx5h 创建。它集成了多种实用功能，如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

10个月前

0209K

CapsWriter-Offline：PC端的语音输入和字幕转录工具

综合介绍 CapsWriter-Offline 是一个专注于PC端的语音输入和字幕转录工具，托管于 GitHub，由开发者 HaujetZhao 打造。它完全离线运行，无需联网即可实现语音转文字和音视...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

065.7K

Whisper Input：利用Groq免费且高速的语音转录文本服务

综合介绍 Whisper Input 是一个开源的语音转译工具，用户可以通过按下 Option 按钮开始录制语音，抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo ...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

072.5K

LiberSonora：有声书字幕提取与多语言翻译，有声小说转录为多语言

综合介绍 LiberSonora，寓意“自由的声音”，是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能，能够在GPU加速下进行批量离线处理。LiberSo...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

1年前

053.1K

AudioNotes：快速提取音视频内容并生成结构化笔记

综合介绍 AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统。它能够快速提取音视频内容，并调用大模型进行整理，生成一份结构化的 Markdown 笔记，方便用...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

056.2K

Orate：集成知名语音生成、语音转录与变声模型的统一API

综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API，能够与领先的AI提供商（如OpenAI、ElevenLabs和AssemblyAI）无缝集成，帮助用户创建逼...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

1年前

063.4K

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

综合介绍 PengChengStarling（鹏城实验室）是一个多语言自动语音识别（ASR）工具，能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发，提供了完整的语音识别流程...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

058.5K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

综合介绍 RealtimeSTT 是一个高效、低延迟的实时语音转文字库，具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发，旨在为需要快速、准确语音转文字的应用提供支持...

AI新闻 # AI开源项目 # AI语音转文本

1年前

087.5K

Sherpa-ONNX：使用ONNXRuntime实现离线语音识别和合成

综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目，旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台，包括 Android、iOS、Raspber...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

1年前

0280.2K

Acoust：在线AI语音生成和文本转语音（TTS）服务平台

综合介绍 Acoust 是一个在线 AI 语音生成和文本转语音（TTS）服务平台，利用最新的 AI 技术生成逼真的语音。该平台还提供强大的视频编辑工具，使用户无需使用多种软件即可完成视频制作。Acou...

最新AI资源 # AI文本转语音 # AI语音转文本

1年前

052.8K

Notta：AI会议记录与音频转录工具，自动转录会议、采访或录音

综合介绍 Notta是一款功能强大的AI会议记录与音频转录工具，旨在帮助用户自动将会议、采访或录音转化为可搜索的文本。通过Notta，用户可以轻松地转录、编辑、总结和协作，提升工作效率。Notta支持...

最新AI资源 # AI文本与音频/视频总结工具 # AI语音转文本

1年前

075.6K

AI no jimaku gumi：借助AI实现视频多语言字幕自动生成和翻译

综合介绍 AI no jimaku gumi（AI の字幕組）是一个强大的命令行视频字幕处理工具，专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术，包括 Whisper 语音...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

1年前

062.3K

FunClip：智能剪辑视频内容为短片，轻松实现精准视频片段提取/裁剪

综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具，由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型，可以准确识别视频中的语...

最新AI资源 # AI开源项目 # AI语音转文本 # AI音视频编辑

1年前

0109.9K

BetterWhisperX：自动语音识别与说话人分离，提供高精度单词级时间戳

综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本，专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支，该项目由 Federico ...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

074.9K

Freed：AI医疗抄写助手，准确转录医生和患者对话，减少就诊记录文书工作

综合介绍 Freed 是一款专为医疗专业人士设计的 AI 医疗抄写助手。它通过先进的人工智能技术，帮助医生和其他医疗从业者自动记录患者的就诊信息，减少文书工作，提高工作效率。Freed 的 AI 抄写...

最新AI资源 # AI语音转文本

1年前

055.9K

Voicenotes：AI语音笔记，记录与转录语音，智能管理会议内容

综合介绍 Voicenotes 是一款智能语音笔记应用，旨在帮助用户轻松记录和管理语音笔记及会议内容。该应用支持100多种语言的语音转录，用户只需说出想法，Voicenotes 即可自动将其转录为文字...

最新AI资源 # AI笔记 # AI语音转文本

1年前

064.9K

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具，支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Wh...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

1年前

070.6K

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换

综合介绍 Zamzar 是一个功能强大的在线文件转换工具，支持超过 1200 种文件格式的转换。无论是文档、图片、视频、音频还是电子书，Zamzar 都能快速高效地完成转换任务。用户无需下载任何软件...

最新AI资源 # AI开放服务 # AI语音转文本

1年前

077.8K

AI Hear：本地离线运行的实时语音转录与翻译软件

综合介绍如果你在用 MacBook，试试 AI Hear：可以录音、实时本地语音转文字、并翻译、最终导出字幕。可以用它辅助你听跨国会议、英文有声书。 AI Hear是一款本地运行的软件，提供一键实时...

最新AI资源 # AI翻译 # AI语音转文本

1年前

061.7K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

综合介绍 SoniTranslate 是一个强大且用户友好的视频多语言配音工具，旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术，将视频内容翻译成多种语言，并保持音频同步。该项...

最新AI资源 # AI文本转语音 # AI翻译 # AI语音转文本

1年前

0135.6K

FunASR：开源语音识别工具包，说话人分离/ 多人对话语音识别

综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包，旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能，包括语音识别（ASR）、语音端点检测（VAD）、标点恢复、语言模型、说话...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

0155.2K

AsrTools：语音转字幕工具，内置剪映、快手、必剪接口的轻量客户端

综合介绍 AsrTools是一款智能语音转文字工具，内置剪映、快手、必剪等大厂接口，无需GPU或繁琐配置，支持高效的多线程批处理。它基于PyQt5开发，界面美观且用户友好，能够输出SRT和TXT格式字...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

075.6K

Happy Scribe：音频转录和视频字幕平台|免费视频字幕编辑软件

Happy Scribe 综合介绍 Happy Scribe提供自动和人工的音频转写服务，以高准确率将音频转换为文字，并支持多种语言和格式。它包含互动式编辑器、协作工具、多种导出格式、机器翻译等功...

最新AI资源 # AI语音转文本 # AI音视频编辑

2年前

067.4K

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop

综合介绍 Whisper是由Const-me开发的一个GitHub开源项目，专注于使用GPGPU实现OpenAI的Whisper自动语音识别（ASR）模型的高性能推断。这个项目是基于MPL-2.0许可...

最新AI资源 # AI语音转文本

2年前

0104.5K

Buzz：开源离线音频转写翻译工具|IOS语音转录

Buzz 综合介绍 Buzz是一个由chidiwilliams创建的开源项目，它能够在个人电脑上离线转录和翻译音频。该项目依托于OpenAI的Whisper技术，使得用户可以不依赖互联网连接进行音频文...

最新AI资源 # AI语音转文本

2年前

0139.3K

Deepgram：高精度语音识别和合成解决方案服务API

综合介绍 Deepgram是一家专注于语音识别和自然语言处理技术的公司，提供强大的语音到文本（Speech-to-Text）和文本到语音（Text-to-Speech）API。该平台利用先进的人工智能...

最新AI资源 # AI开放服务 # AI语音转文本

1年前

073.2K

Murf AI：变声大师|语音转文本|文本生成语音|音频编辑器

综合介绍 Murf AI是一个强大的在线人工智能语音生成工具，能够将文本转换成近似真人的语音。它提供多达120种以上的AI语音选项，支持20种以上语言，适合各种场合使用，如播客、视频、专业演示等。Mu...

最新AI资源 # AI文本转语音 # AI语音转文本

2年前

055.9K

VideoLingo：视频转录单词级时间轴字幕，视频字幕翻译和本地化配音开源工具

综合介绍 VideoLingo 是一个一站式视频翻译和本地化配音工具，旨在生成 Netflix 级别的高质量字幕，消除生硬的机器翻译和多行字幕，并添加高质量的配音，使全球知识能够跨越语言障碍共享。通过...

最新AI资源 # AI副业赚钱项目 # AI翻译 # AI语音转文本

1年前

064.3K

ALog：便携AI语音日记应用，支持语音转文字。

综合介绍 ALog 是一个基于人工智能的语音日记应用，旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发，并在 GitHub 上开源。用户可以通过语音输入记录日记，应用会自动将语音转换为文...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

059.6K

录咖：一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

综合介绍录咖是一站式音视频处理平台，提供AI视频对话、AI字幕和AI语音转文字服务。功能包括录制屏幕、剪辑视频、转换GIF/音频等，并支持云存储与分享。界面直观，使用方便，还支持多屏幕录制和多语种智...

最新AI资源 # AI文本转视频 # AI文本转语音 # AI语音转文本

1年前

065.4K

CrisperWhisper：精确的逐字语音转录工具

综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具，专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳，甚至在语音填充和停顿的情况下也能准...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

070K

Babelfish.ai：浏览器运行的语音实时转录与翻译应用

综合介绍 Babelfish.ai 是一个基于 Huggingface Transformer.js 和 Supabase Realtime 构建的实时转录和翻译应用。该应用可以在浏览器中加载大模型并...

最新AI资源 # AI开源项目 # AI语音转文本

2年前

051.9K

FreeTTS：免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS 综合介绍 FreeTTS 是一个免费的在线文本转语音工具，用户可以将文本转换为自然声音的语音文件。支持多种语言和声音选择，用户可以将文本转换为 MP3、WAV、OGG 和 ACC 格式...

最新AI资源 # AI文本转语音 # AI语音转文本 # AI音视频编辑

2年前

066.7K

Easy Voice Toolkit：本地部署的AI语音工具箱

综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱，提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

2年前

062.4K

DupDub：AI驱动的视频编辑器|配音|视频翻译|照片数字人

综合介绍 Dupdub是侧重播客和视频演示文稿创作平台，提供一系列AI工具来支持用户的创造力。功能覆盖从文本到视频的创作，提供人工智能语音和视频配音服务，以及视频编辑、转录和字幕制作。 Dupdub又...

最新AI资源 # AI数字人 # AI文本转语音 # AI语音转文本

2年前

053.9K

通义听悟：阿里通义音视频内容转录AI助手

综合介绍通义听悟是阿里云推出的一款工作学习AI助手，专注于音视频内容的转写和分析。它依托阿里云的强大AI模型，能够将音视频内容实时转写成文字，并提供翻译、总结、定位等功能。通义听悟支持多种语言和场景...

最新AI资源 # AI文本与音频/视频总结工具 # AI语音转文本

2年前

066.5K

Insanely Fast Whisper：快速高效的转录语音为文本的开源项目

综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术（如Transformers, Optimum, Flash Attention）的音频转...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

067.3K

Memo AI：视频转字幕、转换多语言字幕的本地客户端

综合介绍 MemoAI是一款功能强大的视频翻译工具，专门用于将视频和音频文件转换为文本、字幕和笔记。不论是YouTube视频、播客还是本地文件，MemoAI都能轻松处理。支持中、英、日等90多种语言的...

最新AI资源 # AI文本转语音 # AI语音转文本 # AI音视频编辑

1年前

064K

pyvideotrans:视频翻译配音工具

pyVideoTrans 综合介绍 pyvideotrans是一个视频翻译配音工具。用户能够将视频内容从一种语言翻译成另一种语言，并在视频中添加相应的配音和字幕。它基于openai-whisper离线...

最新AI资源 # AI文本转语音 # AI语音转文本 # AI音视频编辑

2年前

080.9K

没有了