CatVTON-FLUX: Combinação dos modelos de reparo CATVTON e Flux Fill para esquemas de ajuste virtual

Recursos mais recentes de IAPublicado há 8 meses Círculo de compartilhamento de IA

2.3K 00

Introdução geral

O CatVTON-FLUX é uma solução avançada de ajuste virtual que combina CATVTON (Concatenation Is All You Need for Virtual Try-On with Diffusion Models) e Fluxo Modelos de reparo preenchidos para transferências de vestuário realistas e precisas. Desenvolvido pela nftblackmagic e inspirado no In-Context LoRA para engenharia imediata, o projeto tem como objetivo proporcionar uma experiência de ajuste virtual de alta qualidade por meio do uso de modelagem de difusão e técnicas de LoRA (In-Context LoRA para engenharia imediata). A plataforma permite que os usuários experimentem virtualmente o Hugging Face e conheçam os últimos pesos do modelo e as melhorias de desempenho.

Experiência on-line: https://huggingface.co/spaces/xiaozaa/catvton-flux-try-on

Lista de funções

Ajuste virtual: transferências realistas de roupas usando os modelos CATVTON e Flux.
Suporte a pesos LoRA: fornece pesos LoRA para melhorar o desempenho do modelo.
Demonstração do Gradio: Demonstre o encaixe virtual por meio da plataforma Gradio.
Suporte do Hugging Face: Execute CATVTON-FLUX-TRY-ON no Hugging Face.
Atualização dos pesos do modelo: atualize regularmente os pesos do modelo para melhorar o desempenho e os detalhes.

Usando a Ajuda

Processo de instalação

Certifique-se de que o ambiente de tempo de execução tenha >= 40 GB de VRAM (recomenda-se uma GPU de 80 GB).
Crie e ative um ambiente virtual Python:

   conda create -n flux python=3.10
conda activate flux

Instale as dependências necessárias:

   pip install -r requirements.txt
huggingface-cli login

Processo de uso

Executar a versão LoRA do ajuste

Preparar imagens de entrada, máscaras e imagens de roupas.
Execute o seguinte comando para experimentá-lo:

   python tryon_inference_lora.py \
--image ./example/person/00008_00.jpg \
--mask ./example/person/00008_00_mask.png \
--garment ./example/garment/00034_00.jpg \
--seed 4096 \
--output_tryon test_lora.png \
--steps 30

Executar uma avaliação sem a versão LoRA

Preparar imagens de entrada, máscaras e imagens de roupas.
Execute o seguinte comando para experimentá-lo:

   python tryon_inference.py \
--image ./example/person/00008_00.jpg \
--mask ./example/person/00008_00_mask.png \
--garment ./example/garment/00034_00.jpg \
--seed 42 \
--output_tryon test.png \
--steps 30

Iniciando a demonstração do Gradio

Execute o seguinte comando para iniciar a demonstração do Gradio com pesos LoRA:

   python app.py

Execute o seguinte comando para iniciar a demonstração do Gradio sem pesos LoRA:

   python app_no_lora.py

Procedimento de operação detalhado

Preparação da imagem de entradaTamanho da imagem de entrada: Certifique-se de que a imagem de entrada, a máscara e a imagem da roupa tenham o mesmo tamanho; o tamanho recomendado é 576x768.
Execução do comando test-penetrationSelecione a versão LoRA ou a versão sem LoRA do comando Try On conforme necessário, ajustando parâmetros como seed e etapas para obter os melhores resultados.
Exibir resultadosOs resultados do ajuste serão salvos no caminho de saída especificado, e o usuário poderá visualizar e avaliar os resultados do ajuste.
Interação da interface do GradioPor meio da interface do Gradio, os usuários podem carregar suas próprias imagens e roupas para experimentar uma prova virtual em tempo real.