Introdução geral
O AsrTools é uma ferramenta inteligente de conversão de voz em texto com interfaces integradas de grandes empresas, como Cutscene, Fast, Must Cut etc. Ele oferece suporte ao processamento eficiente de lotes com vários threads sem GPU ou configurações complicadas. Foi desenvolvida com base no PyQt5, com uma interface bonita e fácil de usar, capaz de gerar arquivos de legendas nos formatos SRT e TXT. A ferramenta processa arquivos de áudio na nuvem chamando interfaces de grande fábrica e fornece serviços de conversão de texto estáveis e rápidos, adequados para usuários que precisam processar áudio em texto com eficiência.
Lista de funções
- Chamada da interface de grandes fábricas: suporte para corte de filme, mão rápida, corte obrigatório e outras interfaces de grandes fábricas, para fornecer serviços de alta qualidade
- Não há necessidade de configurações complexas: não são necessárias configurações locais complicadas e de GPU, para que os usuários possam começar a usar facilmente
- Interface de alto valor: baseada em PyQt5 e qfluentwidgets, a interface é bonita e fácil de usar.
- Processamento em lote eficiente: suporta processamento em lote e simultâneo multithread, velocidades rápidas de conversão de texto
- Suporte a vários formatos: suporte à geração de arquivos de legenda SRT e TXT para atender a diferentes necessidades
Usando a Ajuda
Guia de instalação
Instalação a partir de uma versão
- Faça o download do pacoteLiberaçãoVersão.
- Descompacte e execute o AsrTools.exe para iniciar a interface GUI.
- Requisitos do sistema: Windows 10 ou posterior.
download da web
Instalação a partir da fonte (desenvolvedores)
- Clone o repositório e vá para o diretório do projeto:
git clone https://github.com/WEIFENG2333/AsrTools.git cd AsrTools
- Instale a dependência e execute-a:
pip install -r requirements.txt python asr_gui.py
Diretrizes para uso
- Iniciar o aplicativo: Execute o executável baixado ou inicie a interface GUI por meio da linha de comando.
- Select ASR Engine: Selecione o mecanismo ASR a ser usado no menu suspenso (Cutscene, Racer, Must Cut).
- Para adicionar um arquivo: Clique no botão "Select File" (Selecionar arquivo) ou arraste e solte o arquivo/pasta na área especificada.
- Start Processing (Iniciar processamento): clique no botão "Start Processing" (Iniciar processamento), o programa iniciará a conversão automaticamente e gerará arquivos de legenda SRT ou TXT no diretório de áudio original quando terminar (3 threads são mantidos em execução por padrão).
Exemplo de chamada de código puro
- Instale a biblioteca de solicitações:
pip install requests
- Use o código de exemplo:
de bk_asr importação BcutASR, JianYingASR, KuaiShouASR arquivo_de_áudio = "resources/test.mp3" asr = BcutASR(audio_file) O # pode escolher BcutASR, JianYingASR, KuaiShouASR. resultado = asr.run() srt = result.to_srt() # Gerar arquivos de legenda SRT txt = result.to_txt() # Gerar arquivos de legenda TXT json_data = result.to_json() # Retorna um dicionário (com tempo) impressão(txt)