Introdução geral
O Video Subtitle Remover (Video-subtitle-remover, ou VSR) é um software de processamento de vídeo baseado na tecnologia de IA, especialmente projetado para remover legendas e marcas d'água de texto de vídeos. A ferramenta usa vários modelos de algoritmos de IA (STTN, LAMA, PROPAINTER) para identificar e remover de forma inteligente e não destrutiva o texto da legenda dos vídeos e, ao mesmo tempo, preencher e reparar de forma inteligente a área após a remoção das legendas por meio da tecnologia de aprendizagem profunda. O software é compatível com Windows, macOS e Linux e oferece interface gráfica e operação de linha de comando. O VSR pode não apenas processar as legendas na posição especificada, mas também detectar e remover automaticamente todo o texto do vídeo inteiro e oferecer suporte ao processamento em lote de texto com marca d'água na imagem. Essa ferramenta é especialmente adequada para criadores de conteúdo e editores de vídeo que precisam processar clipes de vídeo com legendas codificadas.
O software geral só pode borrar a marca d'água, que parece muito pouco natural, e o VSR gerará um pequeno pedaço da imagem para cobrir a marca d'água; esse pequeno pedaço da imagem é desenhado por IA, e a articulação da imagem ao redor é muito natural. O resultado final pode ser considerado explosivo!
Prós do VSR: remove muito bem as marcas d'água de vídeo e as legendas incorporadas. Contras: Não é possível remover marcas d'água em movimento. O software é bastante grande.
Dica VSR: Algumas marcas d'água estão próximas da cor de fundo do vídeo, o efeito de remoção não é bom. Você pode usar o recorte para adicionar uma marca d'água de alto contraste sobre a marca d'água original e, em seguida, usar o VSR para removê-la, o efeito será muito bom.
Lista de funções
- A resolução sem perdas remove as legendas rígidas do vídeo e mantém a qualidade original do vídeo.
- Suporte a vários modelos de algoritmos de IA (STTN, LAMA, PROPAINTER) para restauração inteligente da área de legendas
- Suporta a remoção direcionada de posições de legendas personalizadas
- Suporta a detecção automática de vídeo completo e a remoção de todo o conteúdo de texto
- Fornece a função de remoção de texto de marca d'água em lote de imagens
- Suporta operação em várias plataformas (Windows/macOS/Linux)
- Oferece dois modos de operação: interface gráfica (GUI) e linha de comando (CLI).
- Suporta parâmetros de processamento personalizados, os efeitos de remoção podem ser ajustados de acordo com os requisitos
- Suporta processamento acelerado por GPU para aumentar a eficiência do processamento
Usando a Ajuda
Preparação para a instalação
- Requisitos do sistema:
- Deve estar equipado com uma placa de vídeo Nvidia (configuração mínima: GTX 1060 ou superior)
- A CPU precisa suportar o conjunto de instruções AVX
- Ambiente de tempo de execução Python 3.8+
- Obtenha o software:
- Maneira 1: Faça o download direto da versão empacotada (recomendado para iniciantes)
- Versão GPU do Windows v1.1.0 Download:
- Caminho 2: Instalação do código-fonte (para desenvolvedores)
- Clonagem ou download do código do repositório do GitHub
- Siga as instruções para configurar o ambiente de desenvolvimento
- Maneira 1: Faça o download direto da versão empacotada (recomendado para iniciantes)
método operacional
- A versão empacotada é executada:
- Descompacte o arquivo zip baixado
- Execute o programa diretamente para usá-lo
- A versão do código-fonte é executada:
- Crie um ambiente virtual Python:
conda create -n videoEnv python=3.8 conda activate videoEnv
- Instalação do CUDA e do cuDNN (escolha o método de instalação correspondente de acordo com o sistema operacional)
- Instale a dependência:
pip install -r requirements.txt
- Executar o programa:
- Versão da interface gráfica:
python gui.py
- Versão da linha de comando:
python . /backend/main.py
- Versão da interface gráfica:
- Crie um ambiente virtual Python:
Dicas e truques
- Otimização do desempenho:
Se o processamento estiver lento, você poderá aumentar a velocidade modificando os parâmetros em backend/config.py:MODE = InpaintMode.STTN # Usar o algoritmo STTN STTN_SKIP_DETECTION = True # Ignorar a detecção de legendas para aumentar a velocidade
- Otimização da eficácia:
Diferentes algoritmos podem ser selecionados para diferentes tipos de vídeos:- Algoritmo STTN: adequado para vídeo de ação ao vivo, velocidades de processamento rápidas
- Algoritmo LAMA: adequado para processamento de imagens e vídeos animados
- Algoritmo PROPAINTER: adequado para vídeos com movimentos extenuantes
- Ajuste de parâmetros:
O processamento pode ser aprimorado com o ajuste dos seguintes parâmetros:Parâmetros do algoritmo STTN do # STTN_NEIGHBOR_STRIDE = 10 # Número de quadros vizinhos STTN_REFERENCE_LENGTH = 10 # Comprimento do quadro de referência STTN_MAX_LOAD_NUM = 30 # Número máximo de quadros processados
- As perguntas mais frequentes são abordadas:
- Se você encontrar o CondaHTTPError, consulte o arquivo de configuração para definir o
- O CUDA 11.8 é recomendado para usuários de placas de vídeo 4090.
- Problemas de descompressão do 7z: é necessário atualizar o software de descompressão para a versão mais recente
Advertências:
- São necessárias placas de vídeo NVIDIA, mas não há suporte para placas de vídeo AMD.
- O efeito de processamento está relacionado ao desempenho da placa de vídeo; quanto maior a configuração, melhor o efeito
- Algoritmos diferentes são adequados para cenários diferentes; recomenda-se escolher de acordo com o tipo de vídeo
- Para modelos personalizados, consulte os métodos de treinamento na pasta de design
Endereço para download do VSR Quark