TransRouter: инструмент преобразования аудио в реальном времени для перевода с китайского на английский на основе мультимодальной модели Gemini
Общее введение
TransRouter - это Google Близнецы TransRouter - это инструмент голосового перевода в реальном времени для больших моделей, разработанный специально для голосового перевода в реальном времени между английским и китайским языками. TransRouter легко интегрируется в программное обеспечение для видеоконференций, такое как Zoom, и использует технологию потоковой обработки для обеспечения низкой задержки в процессе перевода, а также обладает функцией автоматического синтеза речи. Система может не только обрабатывать аудиосигналы в режиме реального времени, но и автоматически сохранять исходную запись и синтезированный звук для последующего просмотра и записи. Проект полностью с открытым исходным кодом, разработан на языке Python и отличается хорошей масштабируемостью и настраиваемостью.

Список функций
- Осуществляйте двусторонний голосовой перевод в режиме реального времени с китайского на английский
- Поддерживает бесшовную интеграцию с ведущим программным обеспечением для проведения конференций, таким как Zoom
- Высококачественные переводы с использованием макромодели Google Gemini
- Обеспечивает обработку потокового аудио с низкой задержкой
- Автоматический вывод синтеза речи
- Поддержка автоматического сохранения оригинальных записей и переведенных аудиозаписей
- Обеспечьте полную систему протоколирования
- Поддержка маршрутизации виртуальных аудиоустройств
- Настраиваемые параметры входного и выходного аудиосигнала
Использование помощи
Подготовка системной среды
- Основные экологические требования:
- Python 3.8 или выше
- Операционная система macOS
- Стабильное сетевое соединение
- Интернет-компания Google Gemini API ключи
- Настройка аудиоустройства:
- Установите виртуальное аудиоустройство BlackHole:
brew install blackhole-2ch
- Настройте аудиоустройства в разделе "Системные настройки":
- Откройте "Системные настройки > Звук".
- Убедитесь, что устройство BlackHole 2ch правильно идентифицировано
- Настройка устройств ввода и вывода по умолчанию
- Установите виртуальное аудиоустройство BlackHole:
Этапы установки
- Хранилище проектов клонирования:
git clone https://github.com/notedit/TransRouter.git cd TransRouter
- Создайте и активируйте виртуальную среду:
python -m venv venv source venv/bin/activate # macOS
- Установите пакеты зависимостей:
pip install -r requirements.txt
- Настройте переменные окружения:
- сделать копию
.env.example
файл.env
- существовать
.env
файл, чтобы установить ключ API Gemini:GEMINI_API_KEY=your_gemini_api_key
- сделать копию
Руководство по настройке Zoom
- Откройте панель настроек масштабирования
- Перейдите к опции "Настройки звука".
- Установка микрофона в качестве устройства по умолчанию в системе
- Установите для динамиков режим "BlackHole 2ch".
Инструкция по применению
- Начните процедуру:
python transrouter.py
- Программа выполняется автоматически:
- Инициализация аудиоустройства
- Установление соединения с Google Gemini
- Запуск захвата и обработки звука
- Управление документами:
- Файлы записи сохраняются в
recordings
каталог (на жестком диске компьютера) - Синтезированный переведенный звук сохраняется в файле
synthesis
каталог (на жестком диске компьютера) - Журнал выполнения сохраняется в
logs
каталог (на жестком диске компьютера)
- Файлы записи сохраняются в
- Оперативный контроль:
- Информация о состоянии отображается в режиме реального времени во время выполнения программы
- Нажмите Ctrl+C, чтобы безопасно остановить программу.
- Автоматическое сохранение всех аудиофайлов при остановке
устранение неисправностей
- Проблемы с аудиооборудованием:
- Убедитесь, что BlackHole правильно установлен и настроен
- Проверка состояния идентификации устройства в системных настройках звука
- Проверка конфигурации параметров звука Zoom
- Проблемы перевода:
- Убедитесь в стабильности сетевого подключения
- Убедитесь, что ключ API настроен правильно
- Просмотр файлов журнала для получения подробных сообщений об ошибках
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...