Aprendizagem pessoal com IA
e orientação prática
讯飞绘镜

InfiniteYou: uma ferramenta de geração e edição de fotos que preserva as características faciais

Introdução geral

O InfiniteYou é um projeto de código aberto desenvolvido pela equipe de criação inteligente da ByteDance. Ele se baseia na tecnologia Diffusion Transformers (DiTs), usando a tecnologia FLUXOA função principal do modelo .1-dev é permitir que os usuários carreguem uma foto e insiram uma descrição de texto para gerar uma nova imagem e, ao mesmo tempo, preservar a identidade da pessoa. O projeto usa a tecnologia InfuseNet para melhorar a semelhança de identidade, combinada com treinamento em vários estágios para otimizar a qualidade da imagem e o alinhamento do texto. O InfiniteYou foi lançado em março de 2025 com código, modelos e uma demonstração on-line, e recebeu atenção da comunidade técnica. Ele é compatível com vários plug-ins e é simples de usar para desenvolvedores, pesquisadores e usuários em geral.

InfiniteYou:保留人脸特征的照片生成与编辑工具-1


 

Lista de funções

  • Remodelagem da retenção de identidadeCarregar uma foto e uma descrição de texto para gerar uma nova imagem e manter as características faciais da pessoa.
  • Geração de imagens de alta qualidadeSaída de imagens nítidas e redução de borrões, distorção das mãos e outros problemas.
  • Otimização do alinhamento do textoGerar resultados que sejam altamente consistentes com o conteúdo da descrição para evitar distorções.
  • Seleção de modelos: Fornecido aes_stage2(preferência por estética) e sim_stage1(Identidade primeiro) dois modos.
  • Extensões de plug-inSuporte a ControlNet, LoRA, IP-Adapter, etc. para maior flexibilidade de geração.

 

Usando a Ajuda

Processo de instalação

O InfiniteYou requer instalação local para funcionar. Abaixo estão as etapas detalhadas:

  1. Preparação ambiental
    • Certifique-se de que o Python 3.8 ou posterior esteja instalado em seu sistema.
    • Instale o Git para fazer download do código.
    • As GPUs NVIDIA e CUDA são recomendadas para melhorar a velocidade de geração.
  2. Código de clonagem
    Digite-o no terminal:
复制复制复制复制复制复制复制复制
复制
git clone https://github.com/bytedance/InfiniteYou.git

Acesse o catálogo:

复制复制复制复制复制复制复制
复制
cd InfiniteYou
  1. Instalação de dependências
    Execute o seguinte comando para instalar as bibliotecas necessárias:
复制复制复制复制复制复制
复制
pip install -r requirements.txt

Se estiver usando uma GPU, será necessário instalar a versão correspondente do PyTorch, por exemplo:

复制复制复制复制复制
复制
pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
  1. Modelos para download
    Acesse https://huggingface.co/ByteDance/InfiniteYou para fazer o download infu_flux_v1.0 na pasta aes_stage2 talvez sim_stage1 no local correspondente do diretório do projeto.
  2. Demo em execução
    Instale o Gradio:
复制复制复制复制
复制
pip install gradio

Inicie a interface local:

复制复制复制
复制
python app.py

O navegador será aberto http://127.0.0.1:7860A seguir, apresentamos uma lista dos produtos mais populares e mais procurados disponíveis no mercado.

Funções principais

Reconstrução de fotos de preservação da identidade

  1. Fazer upload de fotos
    Na interface do Gradio, clique em "Upload Identity Image" (Carregar imagem de identidade) e selecione uma foto nítida de seu rosto.
  2. Descrição da entrada
    Digite uma descrição específica na caixa "Prompt text" (Texto do prompt), por exemplo, "A woman in a red dress in the forest" (Uma mulher em um vestido vermelho na floresta).
  3. Parâmetros de configuração
  • Seleção de modelos:aes_stage2 Foco na estética.sim_stage1 Ênfase na semelhança de identidade.
  • Ajuste do parâmetro: padrão infusenet_conditioning_scale por causa de 1.0(matemática) gêneroinfusenet_guidance_start por causa de 0.0. Se as identidades não forem suficientemente semelhantes, tente ajustar a última para o 0.1.
  • Valor da semente (Seed): mantenha o padrão ou defina manualmente.
  1. Geração de imagens
    Clique em "Generate" (Gerar) e aguarde cerca de 120 segundos para que o resultado seja exibido na tela.

Raciocínio rápido de scripts

É executado no terminal:

复制复制
复制
python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results

Os resultados gerados são salvos no arquivo results Pasta.

Demonstração on-line

Visite https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX para experimentá-lo sem instalação.

Uso do plug-in

  • ControlNetImagem de referência de pose: Carregue uma imagem de referência de pose para controlar a ação que gera o resultado.
  • LoRAPlug-ins Realism e Anti-blur são compatíveis, e o caminho deve ser especificado manualmente, por exemplo <path_to_lora>.
  • Adaptador IPAdicione uma tabela de referência de estilo para um estilo personalizado.

Exemplo de operação

Você deseja gerar uma imagem de um "homem de terno em uma sala de conferências":

  1. Faça upload de uma foto do homem.
  2. Digite uma descrição: "Um homem de terno em uma sala de reuniões".
  3. opção aes_stage2Clique em "Generate" (Gerar).
  4. Verifique os resultados e adicione as palavras "a man" (um homem) se precisar ajustar o gênero.

advertência

  • As fotografias precisam ser nítidas e estar voltadas para a frente para evitar bloqueios.
  • Seja específico em suas descrições e evite palavras vagas, como "lindo".
  • O tempo de geração varia de acordo com o hardware e pode ser tão curto quanto 30 a 60 segundos para GPUs.

 

cenário do aplicativo

  1. Conteúdo de mídia social
    Os usuários carregam uma selfie e digitam "wearing gym clothes at the gym" (usando roupas de ginástica na academia) para gerar uma foto com tema de fitness para compartilhamento.
  2. arte
    O artista carrega um retrato que representa um "cavaleiro em traje medieval" para gerar um design conceitual.
  3. teste de pesquisa
    Os pesquisadores usaram o InfiniteYou para comparar os efeitos de retenção de identidade e validar o desempenho dos modelos gerados.

 

QA

  1. É gratuito?
    Sim. O código e o modelo são de código aberto e de uso gratuito para pesquisas acadêmicas.
  2. Quanto tempo leva para gerar?
    120 segundos em média, mais rápido com a GPU.
  3. Ele oferece suporte a fotos multijogador?
    Atualmente otimizado para um único jogador, o suporte para vários jogadores precisa de mais desenvolvimento.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " InfiniteYou: uma ferramenta de geração e edição de fotos que preserva as características faciais
pt_BRPortuguês do Brasil