Aprendizagem pessoal com IA
e orientação prática
豆包Marscode1

Story-Adapter: gerar ilustrações gráficas contínuas e consistentes com base em uma longa história.

Introdução geral

O Story-Adapter é uma estrutura inovadora de visualização de histórias que converte histórias textuais em sequências de imagens coerentes. Desenvolvido por pesquisadores, esse projeto emprega uma abordagem iterativa que não requer treinamento para gerar ilustrações de histórias de alta qualidade. A estrutura é caracterizada por sua capacidade de lidar com histórias longas, manter a consistência semântica entre as imagens e gerar detalhes de interação meticulosos. O Story-Adapter baseia-se em técnicas de modelagem de difusão e garante a coerência e a qualidade das imagens geradas por meio do mecanismo de Atenção Cruzada de Referência Global (GRCA). O projeto é totalmente de código aberto sob a licença MIT e oferece uma ferramenta avançada de visualização de histórias para pesquisadores e desenvolvedores.

Story-Adapter:根据长篇故事生成连续且风格一致的图像-1


 

 

Lista de funções

  • Suporte para visualização de histórias longas
  • Fornecimento de uma estrutura iterativa sem treinamento
  • Implementação do mecanismo de Referência Global de Atenção Cruzada (GRCA)
  • Manutenção da consistência semântica entre as sequências de imagens
  • Gerar efeitos de interação detalhados e de alta qualidade
  • Suporte para entrada de histórias personalizadas
  • Fornecer integração de modelos pré-treinados
  • Suporta a geração de imagens em lote
  • Visualização em tempo real dos resultados da visualização
  • Suporte ao processamento acelerado por GPU

 

Usando a Ajuda

Configuração do ambiente

  1. Requisitos do sistema:
    • Python 3.10.14
    • PyTorch 2.2.2
    • CUDA 12.1
    • cuDNN 8.9.02
  2. Etapas de instalação:
# 克隆仓库
git clone https://github.com/jwmao1/story-adapter.git
cd story-adapter
# 创建并激活conda环境
conda create -n StoryAdapter python=3.10
conda activate StoryAdapter 
# 安装依赖包
pip install -r requirements.txt
  1. Faça o download dos arquivos de modelo necessários:
    • RealVisXL_V4.0: baixado do site Hugging Face e colocado no diretório ". /RealVisXL_V4.0".
    • CLIP Image Encoder: faça o download e coloque-o no diretório ". /IP-Adapter/sdxl_models/image_encoder".
    • IP-adapter_sdxl: faça o download e coloque em ". /IP-Adapter/sdxl_models/ip-adapter_sdxl.bin"

Uso

  1. Execução de demonstração básica:
python run.py --base_model_path your_path/RealVisXL_V4.0 --image_encoder_path your_path/IP-Adapter/sdxl_models/image_encoder --ip_ckpt your_path//IP-Adapter/sdxl_models/ip-adapter_sdxl.bin
  1. Geração de histórias personalizadas:
python run.py --base_model_path your_path/RealVisXL_V4.0 --image_encoder_path your_path/IP-Adapter/sdxl_models/image_encoder --ip_ckpt your_path//IP-Adapter/sdxl_models/ip-adapter_sdxl.bin --story [你的故事文本]

advertência

  1. Certifique-se de que todos os pacotes dependentes e os arquivos de modelo necessários estejam instalados
  2. Verifique se a GPU tem memória suficiente; recomendamos o uso de uma GPU de alto desempenho.
  3. O download e o carregamento do modelo são necessários para a primeira execução e podem levar muito tempo
  4. A qualidade da imagem gerada depende da qualidade da história de entrada e do nível de detalhe da descrição
  5. Recomenda-se que histórias longas sejam processadas em lotes para obter melhores resultados

resolução de falhas

  1. Se você encontrar erros relacionados à CUDA, verifique se a versão da CUDA corresponde à
  2. O tamanho do lote pode ser ajustado quando a memória estiver baixa
  3. Quando o carregamento do modelo falhar, verifique se o caminho do arquivo está correto
  4. Ajuste o nível de detalhes na descrição da história quando a geração não for satisfatória
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Story-Adapter: gerar ilustrações gráficas contínuas e consistentes com base em uma longa história.
pt_BRPortuguês do Brasil