Aprendizagem pessoal com IA
e orientação prática
讯飞绘镜

DiffBIR: a ferramenta de reparo inteligente para melhorar a qualidade da imagem

Introdução geral

O DiffBIR (Blind Image Restoration with Generative Diffusion Prior) é uma ferramenta de restauração de imagens desenvolvida pelo XPixelGroup, que visa à restauração cega de imagens por meio de modelos de difusão generativa. A ferramenta é capaz de lidar com vários problemas de degradação de imagens, como super-resolução de imagens, redução de ruído de imagens e restauração de faces. O DiffBIR usa um modelo avançado de difusão generativa para gerar imagens restauradas de alta qualidade sem depender de um modelo de degradação específico. O projeto é de código aberto no GitHub e fornece instruções detalhadas e modelos pré-treinados para facilitar aos usuários as tarefas de restauração de imagens.

DiffBIR:提升图像质量的智能修复工具-1

Experiência on-line: https://replicate.com/zsxkib/diffbir


 

DiffBIR:提升图像质量的智能修复工具-1

 

Lista de funções

  • Super-resolução cega de imagensAumenta a clareza e os detalhes de imagens de baixa resolução.
  • Restauração de face cegaReparo de imagens de rosto de baixa qualidade ou borradas.
  • Redução de ruído de imagem cegaRuído: Remove o ruído de uma imagem e melhora a qualidade da imagem.
  • Geração de modelos de difusãoRestauração de imagens usando modelagem de difusão generativa para vários cenários de degradação.
  • Modelo de pré-treinamentoRestauração de imagens: fornece uma variedade de modelos pré-treinados para dar suporte a diferentes tipos de tarefas de restauração de imagens.
  • Demonstração on-lineDemonstração on-line: Uma demonstração on-line é fornecida para que os usuários possam experimentar diretamente os resultados da restauração de imagens.

 

Usando a Ajuda

Processo de instalação

  1. armazém de clones::
   git clone https://github.com/XPixelGroup/DiffBIR.git
cd DiffBIR
  1. Instalação de dependências::
   pip install -r requirements.txt
  1. Download do modelo pré-treinadoDownload do modelo pré-treinado paramodelsconsulte a página do projeto para obter links de download de modelos específicos.

Instruções de uso

Restauração de imagens

  1. Preparação da imagem de entradaColoque a imagem a ser restaurada na seçãoinputsCatálogo.
  2. Execução de scripts de inferência::
   python inference.py --input_dir inputs --output_dir outputs

Esse comando fará uma alteração noinputsAs imagens no diretório são restauradas e os resultados são salvos no diretóriooutputsCatálogo.

treinamento de modelos

  1. Preparação do conjunto de dadosColoque o conjunto de dados de treinamento na pastadatapara garantir que o formato de dados atenda aos requisitos.
  2. Executar o script de treinamento::
   python train_stage1.py --config configs/train_stage1.yaml
python train_stage2.py --config configs/train_stage2.yaml

Esse comando executará o primeiro e o segundo estágio de treinamento sequencialmente para gerar o modelo de reparo final.

Fluxo de operação detalhado da função

  1. Super-resolução cega de imagens::
    • Colocar uma imagem de baixa resolução noinputsCatálogo.
    • Execute scripts de inferência para gerar imagens de alta resolução.
    • sondaoutputsa imagem resultante no catálogo para confirmar o efeito do reparo.
  2. Restauração de face cega::
    • Colocar uma imagem de rosto desfocada ou de baixa qualidade noinputsCatálogo.
    • Execute o script de inferência para reparar a imagem do rosto.
    • sondaoutputsa imagem resultante no catálogo para confirmar o efeito do reparo.
  3. Redução de ruído de imagem cega::
    • A imagem que contém o ruído é colocada noinputsCatálogo.
    • Execute o script de inferência para remover o ruído da imagem.
    • sondaoutputsa imagem resultante no catálogo para confirmar o efeito de redução de ruído.

 

Kit de integração do Diffbir 2.1

首席AI分享圈Este conteúdo foi ocultado pelo autor. Digite o código de verificação para visualizar o conteúdo
Captcha:
Preste atenção ao número público do WeChat deste site, responda "CAPTCHA, um tipo de teste de desafio-resposta (computação)", obtenha o código de verificação. Pesquise no WeChat por "Chefe do Círculo de Compartilhamento de IA"ou"Aparência-AI"ou WeChat escaneando o lado direito do código QR pode prestar atenção a esse número público do WeChat do site.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " DiffBIR: a ferramenta de reparo inteligente para melhorar a qualidade da imagem
pt_BRPortuguês do Brasil