Whisper Input：利用Groq免费且高速的语音转录文本服务

综合介绍

Whisper Input 是一个开源的语音转译工具，用户可以通过按下 Option 按钮开始录制语音，抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo 模型进行语音转译，能够在 1-2 秒内快速反馈转译结果。Whisper Input 还支持由 SiliconFlow 托管的 FunAudioLLM/SenseVoiceSmall 模型，提供更快的识别速度和更高的准确性。该项目特别适合需要高效语音输入的用户，包括视力障碍者。

功能列表

语音录制与转译：按下 Option 按钮开始录制，抬起按钮结束录制，自动调用模型进行转译。
多语言支持：支持多种语言的语音转译。
快速反馈：大部分语音输入可以在 1-2 秒内反馈结果。
免费使用：支持 Groq 和 SiliconFlow 提供的免费用量，无需付费。
标点符号支持：自动添加标点符号，提高转译文本的可读性。
无障碍支持：正在开发简易的 macOS 客户端，方便视力障碍用户使用。

使用帮助

安装流程

前提条件：确保本地有 Python 环境，版本不低于 3.10。
克隆项目：

   git clone https://github.com/ErlichLiu/Whisper-Input.git

创建虚拟环境：

   python -m venv venv

激活虚拟环境：
- macOS/Linux: bash source venv/bin/activate
- Windows: bash .\venv\Scripts\activate
安装依赖：

   pip install pip-tools
pip-compile requirements.in
pip install -r requirements.txt

配置模型

Groq Whisper Large V3 模型

注册 Groq 账户：Groq 注册页面
获取 API KEY：Groq API KEY
配置环境变量：

   cp .env.example .env

将 API KEY 粘贴到 .env 文件中：

   SERVICE_PLATFORM=groq
GROQ_API_KEY=你的API_KEY

SiliconFlow FunAudioLLM/SenseVoiceSmall 模型

注册 SiliconFlow 账户：SiliconFlow 注册页面
获取 API KEY：SiliconFlow API KEY
配置环境变量：

   cp .env.example .env

将 API KEY 粘贴到 .env 文件中：

   SERVICE_PLATFORM=siliconflow
SILICONFLOW_API_KEY=你的API_KEY

运行程序

启动程序：

   python main.py

使用方法：按下 Option 按钮开始录制语音，抬起按钮结束录制，程序会自动进行语音转译并反馈结果。

注意事项

后台运行：程序需要一直在后台运行，建议在一个不会经常关闭的终端或终端 Tab 中运行。
无障碍支持：未来将上线 macOS 客户端，方便视力障碍用户使用。

一句话描述（简介）

Whisper Input 是一个高效的语音转译工具，支持多语言语音输入，快速准确地将语音转译为文本，适合需要高效语音输入的用户。

最新AI资源 # AI开源项目 # AI语音转文本

文章版权归 AI分享圈所有，未经允许请勿转载。

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

Cline（Claude Dev）：自动化编程的VSCode插件

最新AI资源 # AI编程

1年前

0122.3K

Julius AI：AI数据分析师|分析EXCEL表格|对话生成数据报表

最新AI资源 # AI数据分析

2年前

066.8K

Book Title Generator：小说书名创意生成器

最新AI资源 # AI写作

2年前

058.7K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

Whisper Input：利用Groq免费且高速的语音转录文本服务

综合介绍

功能列表

使用帮助

安装流程

配置模型

Groq Whisper Large V3 模型

SiliconFlow FunAudioLLM/SenseVoiceSmall 模型

运行程序

注意事项

一句话描述（简介）

Azure TTS Importer：将语音合成服务集成到阅读软件中

Quadratic：集成AI对话和代码执行的在线数据分析表格

相关文章

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

Cline（Claude Dev）：自动化编程的VSCode插件

Julius AI：AI数据分析师|分析EXCEL表格|对话生成数据报表

Book Title Generator：小说书名创意生成器

暂无评论

最新收录

最新文章

Whisper Input：利用Groq免费且高速的语音转录文本服务

综合介绍

功能列表

使用帮助

安装流程

配置模型

Groq Whisper Large V3 模型

SiliconFlow FunAudioLLM/SenseVoiceSmall 模型

运行程序

注意事项

一句话描述（简介）

Azure TTS Importer：将语音合成服务集成到阅读软件中

Quadratic：集成AI对话和代码执行的在线数据分析表格

相关文章

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

Cline（Claude Dev）：自动化编程的VSCode插件

Julius AI：AI数据分析师|分析EXCEL表格|对话生成数据报表

Book Title Generator：小说书名创意生成器

暂无评论

AI工具精选

最新收录

最新文章