Whisper Input: бесплатный и высокоскоростной сервис транскрипции голоса в текст с помощью Groq.
Общее введение
Шепот Input - это инструмент транскрипции речи с открытым исходным кодом, который позволяет пользователям начинать запись речи нажатием кнопки Option и заканчивать запись поднятием кнопки. Инструмент вызывает Groq Модель Whisper Large V3 Turbo выполняет перевод речи и обеспечивает быструю обратную связь за 1-2 секунды.Whisper Input также поддерживает перевод речи с помощью SiliconFlow Хостируемая модель FunAudioLLM/SenseVoiceSmall, обеспечивающая более быстрое распознавание и высокую точность. Она особенно подходит для пользователей, которым требуется эффективный речевой ввод, в том числе для людей с ослабленным зрением.

Список функций
- Запись голоса и перевод: Нажмите кнопку Option, чтобы начать запись, поднимите кнопку, чтобы закончить запись, и автоматически вызовите модель для перевода.
- Поддержка нескольких языков: Поддержка транскрипции речи на нескольких языках.
- Быстрая обратная связь: Большинство голосовых сообщений можно вернуть в течение 1-2 секунд.
- Бесплатное использование: Поддержка бесплатного использования, предоставляемая Groq и SiliconFlow бесплатно.
- Поддержка пунктуации: Пунктуация добавляется автоматически для улучшения читабельности переведенного текста.
- Поддержка доступности: Разрабатывается простой клиент для macOS, предназначенный для пользователей с ослабленным зрением.
Использование помощи
Процесс установки
- предварительные условия: Убедитесь, что у вас есть локальная среда Python, не ниже версии 3.10.
- проект клонирования::
git clone https://github.com/ErlichLiu/Whisper-Input.git
- Создание виртуальной среды::
python -m venv venv
- Активируйте виртуальную среду::
- macOS/Linux.
bash
source venv/bin/activate - Окна.
bash
.\venv\Scripts\activate
- macOS/Linux.
- Установка зависимостей::
pip install pip-tools
pip-compile requirements.in
pip install -r requirements.txt
модель конфигурации
Модель Groq Whisper Large V3
- Зарегистрируйте учетную запись Groq::Страница регистрации Groq
- Получить ключ API::Ключ API Groq
- Настройка переменных среды::
cp .env.example .env
Вставьте ключ API в поле .env
Документация:
SERVICE_PLATFORM=groq
GROQ_API_KEY=你的API_KEY
SiliconFlow FunAudioLLM/SenseVoiceМалые модели
- Зарегистрируйтесь для получения учетной записи SiliconFlow::Страница регистрации SiliconFlow
- Получить ключ API::Ключ API SiliconFlow
- Настройка переменных среды::
cp .env.example .env
Вставьте ключ API в поле .env
Документация:
SERVICE_PLATFORM=siliconflow
SILICONFLOW_API_KEY=你的API_KEY
программа бега
- процедура срабатывания::
python main.py
- Использование: Нажмите кнопку Option, чтобы начать запись голоса, поднимите кнопку, чтобы закончить запись, программа автоматически выполнит голосовой перевод и сообщит о результате.
предостережение
- фоновая операция: Программа должна постоянно работать в фоновом режиме, поэтому рекомендуется запускать ее в терминале или вкладке терминала, которые не закрываются очень часто.
- Поддержка доступности: В будущем будет выпущен клиент для macOS, предназначенный для слабовидящих пользователей.
Описание в одно предложение (краткое)
Whisper Input - это эффективный инструмент преобразования голоса, который поддерживает многоязычный голосовой ввод и быстро и точно преобразует речь в текст для пользователей, которым нужен эффективный голосовой ввод.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...