Aprendizagem pessoal com IA
e orientação prática
讯飞绘镜

AsrTools: ferramenta de fala para legenda, cliente leve com interfaces integradas para Cutscene, Racer e Must-Cut

Introdução geral

O AsrTools é uma ferramenta inteligente de conversão de voz em texto com interfaces integradas de grandes empresas, como Cutscene, Fast, Must Cut etc. Ele oferece suporte ao processamento eficiente de lotes com vários threads sem GPU ou configurações complicadas. Foi desenvolvida com base no PyQt5, com uma interface bonita e fácil de usar, capaz de gerar arquivos de legendas nos formatos SRT e TXT. A ferramenta processa arquivos de áudio na nuvem chamando interfaces de grande fábrica e fornece serviços de conversão de texto estáveis e rápidos, adequados para usuários que precisam processar áudio em texto com eficiência.

AsrTools:智能语音转文字工具,剪影、快手、必剪逆向接口-1


 

Lista de funções

  • Chamada da interface de grandes fábricas: suporte para corte de filme, mão rápida, corte obrigatório e outras interfaces de grandes fábricas, para fornecer serviços de alta qualidade
  • Não há necessidade de configurações complexas: não são necessárias configurações locais complicadas e de GPU, para que os usuários possam começar a usar facilmente
  • Interface de alto valor: baseada em PyQt5 e qfluentwidgets, a interface é bonita e fácil de usar.
  • Processamento em lote eficiente: suporta processamento em lote e simultâneo multithread, velocidades rápidas de conversão de texto
  • Suporte a vários formatos: suporte à geração de arquivos de legenda SRT e TXT para atender a diferentes necessidades

 

Usando a Ajuda

Guia de instalação

Instalação a partir de uma versão

  1. Faça o download do pacoteLiberaçãoVersão.
  2. Descompacte e execute o AsrTools.exe para iniciar a interface GUI.
  3. Requisitos do sistema: Windows 10 ou posterior.

download da web

首席AI分享圈Este conteúdo foi ocultado pelo autor. Digite o código de verificação para visualizar o conteúdo
Captcha:
Preste atenção ao número público do WeChat deste site, responda "CAPTCHA, um tipo de teste de desafio-resposta (computação)", obtenha o código de verificação. Pesquise no WeChat por "Chefe do Círculo de Compartilhamento de IA"ou"Aparência-AI"ou WeChat escaneando o lado direito do código QR pode prestar atenção a esse número público do WeChat do site.

 

Instalação a partir da fonte (desenvolvedores)

  1. Clone o repositório e vá para o diretório do projeto:
    git clone https://github.com/WEIFENG2333/AsrTools.git
    cd AsrTools
    
  2. Instale a dependência e execute-a:
    pip install -r requirements.txt
    python asr_gui.py
    

Diretrizes para uso

  1. Iniciar o aplicativo: Execute o executável baixado ou inicie a interface GUI por meio da linha de comando.
  2. Select ASR Engine: Selecione o mecanismo ASR a ser usado no menu suspenso (Cutscene, Racer, Must Cut).
  3. Para adicionar um arquivo: Clique no botão "Select File" (Selecionar arquivo) ou arraste e solte o arquivo/pasta na área especificada.
  4. Start Processing (Iniciar processamento): clique no botão "Start Processing" (Iniciar processamento), o programa iniciará a conversão automaticamente e gerará arquivos de legenda SRT ou TXT no diretório de áudio original quando terminar (3 threads são mantidos em execução por padrão).

Exemplo de chamada de código puro

  1. Instale a biblioteca de solicitações:
    pip install requests
    
  2. Use o código de exemplo:
    from bk_asr import BcutASR, JianYingASR, KuaiShouASR
    
    audio_file = "resources/test.mp3"
    asr = BcutASR(audio_file)  # 可以选择BcutASR, JianYingASR, KuaiShouASR
    result = asr.run()
    srt = result.to_srt()  # 生成SRT字幕文件
    txt = result.to_txt()  # 生成TXT字幕文件
    json_data = result.to_json()  # 返回一个字典(包含时间)
    print(txt)
    
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " AsrTools: ferramenta de fala para legenda, cliente leve com interfaces integradas para Cutscene, Racer e Must-Cut
pt_BRPortuguês do Brasil