ConsisID: um mapa de referência de retratos para gerar vídeos consistentes com caracteres, integração rápida de vários terminais
Introdução abrangente O ConsisID é um projeto de código-fonte aberto desenvolvido pelo grupo de Yuan Rong na Universidade de Pequim, com o objetivo de obter geração de texto para vídeo consistente com a identidade (IPT2V) por meio de técnicas de decomposição de frequência. O núcleo do projeto é um sistema DiT (Diffusion Transfor...