Introdução geral
O DiffBIR (Blind Image Restoration with Generative Diffusion Prior) é uma ferramenta de restauração de imagens desenvolvida pelo XPixelGroup, que visa à restauração cega de imagens por meio de modelos de difusão generativa. A ferramenta é capaz de lidar com vários problemas de degradação de imagens, como super-resolução de imagens, redução de ruído de imagens e restauração de faces. O DiffBIR usa um modelo avançado de difusão generativa para gerar imagens restauradas de alta qualidade sem depender de um modelo de degradação específico. O projeto é de código aberto no GitHub e fornece instruções detalhadas e modelos pré-treinados para facilitar aos usuários as tarefas de restauração de imagens.
Lista de funções
- Super-resolução cega de imagensAumenta a clareza e os detalhes de imagens de baixa resolução.
- Restauração de face cegaReparo de imagens de rosto de baixa qualidade ou borradas.
- Redução de ruído de imagem cegaRuído: Remove o ruído de uma imagem e melhora a qualidade da imagem.
- Geração de modelos de difusãoRestauração de imagens usando modelagem de difusão generativa para vários cenários de degradação.
- Modelo de pré-treinamentoRestauração de imagens: fornece uma variedade de modelos pré-treinados para dar suporte a diferentes tipos de tarefas de restauração de imagens.
- Demonstração on-lineDemonstração on-line: Uma demonstração on-line é fornecida para que os usuários possam experimentar diretamente os resultados da restauração de imagens.
Usando a Ajuda
Processo de instalação
- armazém de clones::
git clone https://github.com/XPixelGroup/DiffBIR.git
cd DiffBIR
- Instalação de dependências::
pip install -r requirements.txt
- Download do modelo pré-treinadoDownload do modelo pré-treinado para
modelos
consulte a página do projeto para obter links de download de modelos específicos.
Instruções de uso
Restauração de imagens
- Preparação da imagem de entradaColoque a imagem a ser restaurada na seção
insumos
Catálogo. - Execução de scripts de inferência::
python inference.py --input_dir inputs --output_dir outputs
Esse comando fará uma alteração noinsumos
As imagens no diretório são restauradas e os resultados são salvos no diretóriosaídas
Catálogo.
treinamento de modelos
- Preparação do conjunto de dadosColoque o conjunto de dados de treinamento na pasta
dados
para garantir que o formato de dados atenda aos requisitos. - Executar o script de treinamento::
python train_stage1.py --config configs/train_stage1.yaml
python train_stage2.py --config configs/train_stage2.yaml
Esse comando executará o primeiro e o segundo estágio de treinamento sequencialmente para gerar o modelo de reparo final.
Fluxo de operação detalhado da função
- Super-resolução cega de imagens::
- Colocar uma imagem de baixa resolução no
insumos
Catálogo. - Execute scripts de inferência para gerar imagens de alta resolução.
- sonda
saídas
a imagem resultante no catálogo para confirmar o efeito do reparo.
- Colocar uma imagem de baixa resolução no
- Restauração de face cega::
- Colocar uma imagem de rosto desfocada ou de baixa qualidade no
insumos
Catálogo. - Execute o script de inferência para reparar a imagem do rosto.
- sonda
saídas
a imagem resultante no catálogo para confirmar o efeito do reparo.
- Colocar uma imagem de rosto desfocada ou de baixa qualidade no
- Redução de ruído de imagem cega::
- A imagem que contém o ruído é colocada no
insumos
Catálogo. - Execute o script de inferência para remover o ruído da imagem.
- sonda
saídas
a imagem resultante no catálogo para confirmar o efeito de redução de ruído.
- A imagem que contém o ruído é colocada no