Introdução geral
O AI2SRT é um projeto de código aberto que utiliza o GeminiAI Big Model para gerar vídeos curtos narrados e resumos de vídeo para vídeos longos com um clique, além de oferecer suporte a legendas de transcrição de áudio e vídeo. O projeto tem como objetivo simplificar o processo de criação de conteúdo de vídeo e oferecer funções eficientes de geração e tradução de legendas. Os usuários podem converter rapidamente vídeos longos em vídeos curtos e gerar arquivos de legendas correspondentes por meio de operações simples, que são adequadas para uma variedade de cenários, como educação, entretenimento e promoção de negócios.
Projetada com uma interface da Web, a ferramenta é simples e intuitiva de usar e é compatível com várias plataformas, incluindo Windows, Linux e Mac. Com a poderosa capacidade do Gemini de entender de forma inteligente o conteúdo do vídeo, gerar uma cópia de narração profissional e oferecer suporte à tradução de legendas de alta qualidade usando o método de reflexão em três etapas, a ferramenta é um assistente poderoso para criadores de vídeo e editores de conteúdo. Como pyVideoTrans São usadas ferramentas de correspondência.
Lista de funções
- Vídeo longo com um clique para criar a função de vídeo curto com comentários de IA
- Geração inteligente de relatórios resumidos de conteúdo de vídeo
- Suporte ao método de reflexão em três etapas para traduzir arquivos de legendas SRT
- Transcrição automática de arquivos de áudio e vídeo para legendas SRT
- Operação de interface da Web, suporte para uso em várias plataformas
- Suporte a palavras de alerta de IA personalizadas para otimizar a saída
- Interface GeminiAI integrada, compatível com gemini-1.5-flash e outros modelos
Usando a Ajuda
1. preparação ambiental
Antes de começar a usar o ai2srt, você precisa garantir as seguintes condições:
- Ambiente de proxy da Web estável (obrigatório)
- Chave de API da GeminiAI (aplicativo gratuito disponível)
- Escolha da versão correta do sistema operacional
2. instalação e implementação
Implementação rápida para usuários do Windows:
- Faça o download da versão pré-empacotada mais recente na página de versões do GitHub
- Extraia o zip baixado (por exemplo, window-gemini-video-tools-0.3.7z)
- Clique duas vezes no arquivo "startup.bat" para executar o programa.
- O programa abrirá automaticamente a interface do operador em seu navegador: http://127.0.0.1:5030
Etapas de implementação para usuários de Linux/Mac:
- Clonar o repositório de código:
git clone https://github.com/jianchang512/ai2srt
- Vá para o catálogo de projetos:
cd ai2srt
- Criar e ativar um ambiente virtual:
python3 -m venv venv
fonte . /venv/bin/activate
- Instale os pacotes de dependência:
pip3 install -r requirements.txt
- Inicie o aplicativo:
python3 app.py
3. descrição do uso funcional
3.1 Criação de narração de vídeo
- Faça upload de arquivos de vídeo longos para serem processados na interface da Web
- Selecione a função "Create Narration Video" (Criar vídeo de narração).
- Configurar parâmetros e palavras de alerta do GeminiAI (opcional)
- Clique em Start Processing (Iniciar processamento) e aguarde até que a IA analise e gere o comentário
- O sistema sintetizará automaticamente um novo vídeo com narração
3.2 Transcrição e tradução de legendas
- Fazer upload de arquivos de áudio e vídeo a serem processados
- Selecione a função "Subtitle Transcription" (Transcrição de legendas) ou "Subtitle Translation" (Tradução de legendas).
- Para a função de tradução, um processo de reflexão em três etapas pode ser usado para garantir a qualidade da tradução
- Aguarde a conclusão do processamento e faça o download do arquivo de legenda SRT resultante.
3.3 Geração de resumo de vídeo
- Carregar arquivo de vídeo
- Selecione a função "Video Summary" (Resumo do vídeo).
- Aguardando que a IA analise o conteúdo de vídeo e gere relatórios resumidos
4. cuidados
- Certifique-se de que o proxy de rede esteja estável durante o uso, pois esse é o segredo para garantir que a ferramenta funcione corretamente
- Recomenda-se usar o modelo gemini-1.5-flash, que tem uma cota de uso livre alta
- A saída de IA pode ser otimizada com o ajuste das palavras-chave
- Se você encontrar uma falha de processamento, verifique primeiro o status do proxy de rede
- Esteja ciente da necessidade de manter a versão do programa atualizada com os recursos e as otimizações mais recentes.