One-Prompt-One-Story: os prompts de texto geram imagens consistentes de identidade de personagem

Recursos mais recentes de IAPublicado há 8 meses Círculo de compartilhamento de IA

16.3K 00

Introdução geral

One-Prompt-One-Story (1Prompt1Story) é uma ferramenta inovadora de geração de texto para imagem projetada para permitir a geração consistente de imagens a partir de um único prompt. Foi apresentada no ICLR 2025 por Tao Liu et al. Ela emprega uma abordagem sem treinamento que gera imagens de alta qualidade e, ao mesmo tempo, mantém a consistência na identidade dos caracteres. 1Prompt1Story funciona com todos os modelos de texto para imagem baseados em embeddings de texto e oferece suporte à geração de vários caracteres, geração guiada por ControlNet e geração personalizada. A ferramenta garante que as imagens geradas sejam altamente consistentes com a descrição de entrada por meio de uma única entrada solicitada, combinada com reponderação de valor singular e técnicas de atenção cruzada que preservam a identidade.

Lista de funções

Geração de imagem de identidade consistenteGeração de imagens que mantêm a identidade consistente dos caracteres por meio de uma única entrada de dados.
Demonstração do GradioDemonstração on-line: Uma demonstração on-line é fornecida para testes e experiência do usuário.
Consistory+ BenchmarkingConjunto de dicas: contém 200 conjuntos de dicas, cada um contendo entre 5 e 10 dicas, divididos em 8 superclasses.
Geração de várias funçõesSuporte para geração de imagens com vários caracteres.
Geração de bootstrap ControlNetGuia o processo de geração por meio da tecnologia ControlNet.
PersonalizaçãoSuporte à geração de imagens reais personalizadas com base nos requisitos do usuário.

Usando a Ajuda

Processo de instalação

Clone esse repositório:

   git clone https://github.com/byliutao/1Prompt1Story

Vá para o diretório do repositório:

   cd 1Prompt1Story

Criar e ativar um ambiente virtual:

   conda create --name 1p1s python=3.10
conda activate 1p1s

Instalar dependências:

   conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
conda install conda-forge::transformers
conda install -c conda-forge diffusers
pip install opencv-python scipy gradio==4.44.1 sympy==1.13.1

Processo de uso

Execute o código de amostra:

   python main.py

Execute a demonstração do Gradio:

   python app.py

Execute o benchmark Consistory+:

   python -m resource.gen_benchmark --save_dir ./result/benchmark --benchmark_path ./resource/consistory+.yaml

Funções principais

Geração de imagem de identidade consistenteImagem: Digite um único prompt descrevendo a identidade e a cena do personagem na caixa de entrada e clique no botão Generate (Gerar) para obter uma imagem que mantenha a identidade do personagem.
Geração de várias funçõesInclua várias descrições de função no prompt e a ferramenta gerará automaticamente uma imagem contendo todas as funções.
Geração de bootstrap ControlNetDescrições relacionadas ao ControlNet são adicionadas aos prompts, e o processo de geração é orientado de acordo com a tecnologia ControlNet para garantir que as imagens sejam altamente consistentes com as descrições.
PersonalizaçãoGerar uma imagem real que atenda aos requisitos com base em uma descrição personalizada inserida pelo usuário.

Recursos mais recentes de IA # Controle de estilo de imagem AI # Projeto de código aberto AI Java

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

Minduck: pesquisa de conhecimento externo com estruturas de informações de mapeamento mental

Recursos mais recentes de IA Ferramenta de busca # AI

8 meses atrás

017.6K

Genie 3 - O modelo universal do mundo do Google

Recursos mais recentes de IA

2 meses atrás

018.7K

DeepSeek Engineer：基于DeepSeek API的实验性编码助手,附提示词

DeepSeek Engineer: um assistente de codificação experimental baseado na API do DeepSeek, com palavras-chave

Recursos mais recentes de IA # Projeto de código aberto AI Java

7 meses atrás

018.2K

CodeWeaver: gere automaticamente documentos Markdown a partir da estrutura e do conteúdo do código.

Recursos mais recentes de IA # Projeto de código aberto AI Java # Extração e limpeza de documentos

7 meses atrás

017.9K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

One-Prompt-One-Story: os prompts de texto geram imagens consistentes de identidade de personagem

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Processo de uso

Funções principais

Adição de uma ferramenta de bate-papo on-line orientada por RAG aos aplicativos Next.js

Sigma AI Browser: um navegador de IA gratuito para usar grandes modelos convencionais

Artigos relacionados

Minduck: pesquisa de conhecimento externo com estruturas de informações de mapeamento mental

Genie 3 - O modelo universal do mundo do Google

DeepSeek Engineer: um assistente de codificação experimental baseado na API do DeepSeek, com palavras-chave

CodeWeaver: gere automaticamente documentos Markdown a partir da estrutura e do conteúdo do código.

Sem comentários

Últimas coleções

Artigos mais recentes

One-Prompt-One-Story: os prompts de texto geram imagens consistentes de identidade de personagem

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Processo de uso

Funções principais

Adição de uma ferramenta de bate-papo on-line orientada por RAG aos aplicativos Next.js

Sigma AI Browser: um navegador de IA gratuito para usar grandes modelos convencionais

Artigos relacionados

Minduck: pesquisa de conhecimento externo com estruturas de informações de mapeamento mental

Genie 3 - O modelo universal do mundo do Google

DeepSeek Engineer: um assistente de codificação experimental baseado na API do DeepSeek, com palavras-chave

CodeWeaver: gere automaticamente documentos Markdown a partir da estrutura e do conteúdo do código.

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes