Aprendizagem pessoal com IA
e orientação prática

One-Prompt-One-Story: os prompts de texto geram imagens consistentes de identidade de personagem

Introdução geral

One-Prompt-One-Story (1Prompt1Story) é uma ferramenta inovadora de geração de texto para imagem projetada para permitir a geração consistente de imagens a partir de um único prompt. Foi apresentada no ICLR 2025 por Tao Liu et al. Ela emprega uma abordagem sem treinamento que gera imagens de alta qualidade e, ao mesmo tempo, mantém a consistência na identidade dos caracteres. 1Prompt1Story funciona com todos os modelos de texto para imagem baseados em embeddings de texto e oferece suporte à geração de vários caracteres, geração guiada por ControlNet e geração personalizada. A ferramenta garante que as imagens geradas sejam altamente consistentes com a descrição de entrada por meio de uma única entrada solicitada, combinada com reponderação de valor singular e técnicas de atenção cruzada que preservam a identidade.

One-Prompt-One-Story: uma ferramenta gratuita para gerar imagens consistentes com o estilo a partir de texto-1


 

Lista de funções

  • Geração de imagem de identidade consistenteGeração de imagens que mantêm a identidade consistente dos caracteres por meio de uma única entrada de dados.
  • Demonstração do GradioDemonstração on-line: Uma demonstração on-line é fornecida para testes e experiência do usuário.
  • Consistory+ BenchmarkingConjunto de dicas: contém 200 conjuntos de dicas, cada um contendo entre 5 e 10 dicas, divididos em 8 superclasses.
  • Geração de várias funçõesSuporte para geração de imagens com vários caracteres.
  • Geração de bootstrap ControlNetGuia o processo de geração por meio da tecnologia ControlNet.
  • PersonalizaçãoSuporte à geração de imagens reais personalizadas com base nos requisitos do usuário.

 

Usando a Ajuda

Processo de instalação

  1. Clone esse repositório:
   git clone https://github.com/byliutao/1Prompt1Story
  1. Vá para o diretório do repositório:
   cd 1Prompt1Story
  1. Criar e ativar um ambiente virtual:
   conda create --name 1p1s python=3.10
conda activate 1p1s
  1. Instalar dependências:
   conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
conda install conda-forge::transformers
conda install -c conda-forge diffusers
pip install opencv-python scipy gradio==4.44.1 sympy==1.13.1

Processo de uso

  1. Execute o código de amostra:
   python main.py
  1. Execute a demonstração do Gradio:
   python app.py
  1. Execute o benchmark Consistory+:
   python -m resource.gen_benchmark --save_dir . /result/benchmark --benchmark_path . /resource/consistory+.yaml

Funções principais

  • Geração de imagem de identidade consistenteImagem: Digite um único prompt descrevendo a identidade e a cena do personagem na caixa de entrada e clique no botão Generate (Gerar) para obter uma imagem que mantenha a identidade do personagem.
  • Geração de várias funçõesInclua várias descrições de função no prompt e a ferramenta gerará automaticamente uma imagem contendo todas as funções.
  • Geração de bootstrap ControlNetDescrições relacionadas ao ControlNet são adicionadas aos prompts, e o processo de geração é orientado de acordo com a tecnologia ControlNet para garantir que as imagens sejam altamente consistentes com as descrições.
  • PersonalizaçãoGerar uma imagem real que atenda aos requisitos com base em uma descrição personalizada inserida pelo usuário.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " One-Prompt-One-Story: os prompts de texto geram imagens consistentes de identidade de personagem

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil