Introdução geral
O GFPGAN (Generative Facial Prior GAN) é um algoritmo de reparo facial de código aberto desenvolvido pelo Tencent ARC (Applied Research Center). O algoritmo utiliza os fatores anteriores ricos e diversificados encapsulados em GANs faciais pré-treinados (por exemplo, StyleGAN2) para reparo cego de faces. O GFPGAN pode reparar com eficácia imagens faciais de baixa qualidade, antigas ou geradas por IA, solucionando os problemas de perda de detalhes e desfoque de textura existentes nos métodos tradicionais e obtendo reparo e geração de imagens faciais de alta qualidade.
Lista de funções
- Reparo cego de faces: não são necessárias suposições a priori sobre a imagem de entrada, permitindo um reparo cego verdadeiro.
- Geração de imagens de alta qualidade: usando o conhecimento prévio do GAN facial pré-treinado, os resultados gerados são mais naturais com boa consistência de identidade.
- Processamento de imagens de baixa qualidade: imagens de entrada de qualidade muito baixa podem ser processadas para melhorar a qualidade da imagem.
- Projeto de código aberto: fornecer código-fonte para facilitar o desenvolvimento secundário e a pesquisa por parte dos desenvolvedores.
Usando a Ajuda
- Processo de instalação::
- Clonagem do código do projeto GFPGAN:
git clone https://github.com/TencentARC/GFPGAN.git
- Vá para o diretório do projeto e instale as dependências:
cd GFPGAN pip install -r requirements.txt
- Faça o download do modelo pré-treinado:
wget https://github.com/TencentARC/GFPGAN/releases/download/v1.3.4/GFPGANv1.3.4.pth
- Clonagem do código do projeto GFPGAN:
- Uso::
- Execute o seguinte comando para reparar a face:
python inference_gfpgan.py --input input_image.jpg --output output_image.jpg --model_path GFPGANv1.3.4.pth
- Descrição do parâmetro:
-entrada
Digite o caminho da imagem.--output
Caminho da imagem de saída.---model_path
Caminhos do modelo de pré-treinamento.
- Execute o seguinte comando para reparar a face:
- Procedimento de operação detalhado::
- Pré-processamento de imagensImagem de entrada: A imagem de entrada pode ser cortada e redimensionada para garantir a restauração ideal antes de prosseguir.
- Seleção de modelosEscolha de diferentes modelos pré-treinados de acordo com necessidades específicas: o GFPGAN oferece uma variedade de modelos para se adaptar a diferentes cenários de aplicativos.
- Otimização dos resultadosO resultado pode ser otimizado ainda mais após a fixação, por exemplo, ajustando o brilho, o contraste etc. para obter um melhor efeito visual.
- problemas comuns::
- Resultados insatisfatórios da restauraçãoTente usar modelos pré-treinados diferentes ou pré-processar a imagem de entrada.
- lentoAceleração de GPU: garanta que a aceleração de GPU seja usada e otimize o desempenho do código.
Operação on-line