Whisper Input: бесплатный и высокоскоростной сервис транскрипции голоса в текст с помощью Groq.

Общее введение

Шепот Input - это инструмент транскрипции речи с открытым исходным кодом, который позволяет пользователям начинать запись речи нажатием кнопки Option и заканчивать запись поднятием кнопки. Инструмент вызывает Groq Модель Whisper Large V3 Turbo выполняет перевод речи и обеспечивает быструю обратную связь за 1-2 секунды.Whisper Input также поддерживает перевод речи с помощью SiliconFlow Хостируемая модель FunAudioLLM/SenseVoiceSmall, обеспечивающая более быстрое распознавание и высокую точность. Она особенно подходит для пользователей, которым требуется эффективный речевой ввод, в том числе для людей с ослабленным зрением.

Whisper Input:利用Groq免费且高速的语音转录文本服务

 

Список функций

  • Запись голоса и перевод: Нажмите кнопку Option, чтобы начать запись, поднимите кнопку, чтобы закончить запись, и автоматически вызовите модель для перевода.
  • Поддержка нескольких языков: Поддержка транскрипции речи на нескольких языках.
  • Быстрая обратная связь: Большинство голосовых сообщений можно вернуть в течение 1-2 секунд.
  • Бесплатное использование: Поддержка бесплатного использования, предоставляемая Groq и SiliconFlow бесплатно.
  • Поддержка пунктуации: Пунктуация добавляется автоматически для улучшения читабельности переведенного текста.
  • Поддержка доступности: Разрабатывается простой клиент для macOS, предназначенный для пользователей с ослабленным зрением.

 

Использование помощи

Процесс установки

  1. предварительные условия: Убедитесь, что у вас есть локальная среда Python, не ниже версии 3.10.
  2. проект клонирования::
   git clone https://github.com/ErlichLiu/Whisper-Input.git
  1. Создание виртуальной среды::
   python -m venv venv
  1. Активируйте виртуальную среду::
    • macOS/Linux. bash
      source venv/bin/activate
    • Окна. bash
      .\venv\Scripts\activate
  2. Установка зависимостей::
   pip install pip-tools
pip-compile requirements.in
pip install -r requirements.txt

модель конфигурации

Модель Groq Whisper Large V3

  1. Зарегистрируйте учетную запись Groq::Страница регистрации Groq
  2. Получить ключ API::Ключ API Groq
  3. Настройка переменных среды::
   cp .env.example .env

Вставьте ключ API в поле .env Документация:

   SERVICE_PLATFORM=groq
GROQ_API_KEY=你的API_KEY

SiliconFlow FunAudioLLM/SenseVoiceМалые модели

  1. Зарегистрируйтесь для получения учетной записи SiliconFlow::Страница регистрации SiliconFlow
  2. Получить ключ API::Ключ API SiliconFlow
  3. Настройка переменных среды::
   cp .env.example .env

Вставьте ключ API в поле .env Документация:

   SERVICE_PLATFORM=siliconflow
SILICONFLOW_API_KEY=你的API_KEY

программа бега

  1. процедура срабатывания::
   python main.py
  1. Использование: Нажмите кнопку Option, чтобы начать запись голоса, поднимите кнопку, чтобы закончить запись, программа автоматически выполнит голосовой перевод и сообщит о результате.

предостережение

  • фоновая операция: Программа должна постоянно работать в фоновом режиме, поэтому рекомендуется запускать ее в терминале или вкладке терминала, которые не закрываются очень часто.
  • Поддержка доступности: В будущем будет выпущен клиент для macOS, предназначенный для слабовидящих пользователей.

Описание в одно предложение (краткое)

Whisper Input - это эффективный инструмент преобразования голоса, который поддерживает многоязычный голосовой ввод и быстро и точно преобразует речь в текст для пользователей, которым нужен эффективный голосовой ввод.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...