Introdução geral
O TransRouter é um aplicativo do Google Gêmeos O TransRouter é uma ferramenta de tradução de voz em tempo real para modelos grandes, projetada especificamente para a tradução de voz em tempo real entre inglês e chinês. Perfeitamente integrado ao software de videoconferência, como o Zoom, o TransRouter emprega tecnologia de processamento de streaming para garantir baixa latência no processo de tradução e apresenta síntese automática de voz. O sistema pode não apenas processar sinais de áudio em tempo real, mas também salvar automaticamente a gravação original e o áudio sintetizado para revisão e gravação posteriores. O projeto é totalmente de código aberto, desenvolvido em Python, com boa escalabilidade e capacidade de personalização.
Lista de funções
- Realize tradução de voz bidirecional em tempo real entre chinês e inglês
- Oferece suporte à integração perfeita com os principais softwares de conferência, como o Zoom
- Traduções de alta qualidade usando o macromodelo do Google Gemini
- Oferece processamento de áudio de streaming de baixa latência
- Saída de síntese automática de fala
- Suporta o salvamento automático de gravações originais e áudio traduzido
- Fornecer um sistema de registro completo
- Suporte ao roteamento de dispositivos de áudio virtuais
- Parâmetros configuráveis de entrada e saída de áudio
Usando a Ajuda
Preparação do ambiente do sistema
- Requisitos ambientais básicos:
- Python 3.8 ou superior
- Sistema operacional macOS
- Conexão de rede estável
- Empresa de Internet Google API Gemini chaves
- Configuração do dispositivo de áudio:
- Instale o dispositivo de áudio virtual BlackHole:
brew install blackhole-2ch
- Configure os dispositivos de áudio em Preferências do Sistema:
- Abra "Preferências do sistema > Som".
- Verifique se o dispositivo BlackHole 2ch está identificado corretamente
- Configuração dos dispositivos de entrada e saída padrão
- Instale o dispositivo de áudio virtual BlackHole:
Etapas de instalação
- Clonagem do Project Warehouse:
git clone https://github.com/notedit/TransRouter.git cd TransRouter
- Criar e ativar um ambiente virtual:
python -m venv venv fonte venv/bin/activate # macOS
- Instale os pacotes de dependência:
pip install -r requirements.txt
- Configurar variáveis de ambiente:
- fazer uma cópia de
.env.example
arquivo é.env
- existir
.env
para definir a chave da API do Gemini:GEMINI_API_KEY=sua chave_gemini_api
- fazer uma cópia de
Guia de configuração do Zoom
- Abra o painel de configurações do Zoom
- Vá para a opção Audio Settings (Configurações de áudio)
- Definir o microfone como o dispositivo padrão do sistema
- Defina os alto-falantes como "BlackHole 2ch"
Instruções de uso
- Iniciar o procedimento:
python transrouter.py
- O programa é executado automaticamente:
- Inicialização de um dispositivo de áudio
- Estabelecimento de uma conexão com o Google Gemini
- Iniciar a captura e o processamento de áudio
- Gerenciamento de documentos:
- Os arquivos de gravação são salvos no
registros
diretório (no disco rígido do computador) - O áudio traduzido sintetizado é salvo no arquivo
síntese
diretório (no disco rígido do computador) - O registro de tempo de execução é salvo na pasta
registros
diretório (no disco rígido do computador)
- Os arquivos de gravação são salvos no
- Controles operacionais:
- As informações de status em tempo real são exibidas durante a execução do programa
- Pressione Ctrl+C para interromper o programa com segurança.
- Salva automaticamente todos os arquivos de áudio quando interrompido
resolução de falhas
- Problemas com equipamentos de áudio:
- Verifique se o BlackHole está instalado e configurado corretamente
- Verificação do status da identificação do dispositivo nas configurações de áudio do sistema
- Verificação da configuração das definições de áudio do Zoom
- Problemas de tradução:
- Confirmar conexão de rede estável
- Verifique se a chave da API está configurada corretamente
- Exibir arquivos de registro para mensagens de erro detalhadas