Introdução geral
O Whisper é um projeto de código aberto do GitHub desenvolvido pela Const-me, com foco na inferência de alto desempenho do modelo de reconhecimento automático de fala (ASR) Whisper da OpenAI usando GPGPU. Esse projeto é lançado sob a licença MPL-2.0, com a versão mais recente 1.12 lançada em 22 de julho de 2023. Em termos de código, ele é escrito principalmente em C++, mas também inclui outras linguagens, como C, C# e HLSL.
Download do módulo de idioma dependente: https://huggingface.co/ggerganov/whisper.cpp/tree/main
Lista de funções
Fornecimento de inferência de GPGPU de alto desempenho para modelos OpenAI Whisper
Suporta a mais recente tecnologia ASR
Obtido de comunidades de código aberto confiáveis
Inclui tipos de linguagem de desenvolvimento avançados e histórico de versões
Usando a Ajuda
Faça download do WhisperDesktop.zip na seção "Releases" deste repositório, extraia o arquivo ZIP e execute o WhisperDesktop.exe.
Na primeira tela, ele solicitará o download de um modelo.
Eu recomendaria usar o ggml-medium.bin (1,42 GB de tamanho), pois esse é o modelo que uso na maioria das vezes para testar o software.
Visite o projeto do GitHub para obter o código-fonte e a documentação
Implantação e uso do projeto de acordo com o Leia-me
Modificação e distribuição de acordo com a especificação da licença MPL-2.0
Acompanhe as últimas atualizações de versão e discussões via GitHub
Download do cliente Whisper GPGPU