Conforme verificado por meus amigos, o modelo FLUX gratuito agora gera imagens que não são inferiores ao DALL-E-3 e ao MJ.
Depois que a Controlnet e o ipadapter foram desenvolvidos após o controle livre do estilo de composição da tela e assim por diante, o DALL-E-3 e o MJ basicamente não têm vantagem, apenas desvantagem.
1. observando o gráfico primeiro, fica claro que o FLUX é muito mais avançado em termos de pontuação de classificação ELO.
A organização, conhecida por seu acrônimo BFL (Black Forest Labs Black Forest Labs), é uma organização que redesenha e avança modelos avançados de aprendizagem profunda generativa para mídia, como imagens e vídeos, e se esforça para estimular a criatividade em modelos que rompem os limites da eficiência e da diversidade. Apenas em agosto, o lançamento de FLUXO.1 O conjunto de modelos, que é uma nova tecnologia que define os detalhes da imagem, a aderência ao comando de dicas, a variedade de estilos e a complexidade da cena para a composição de texto para imagem.
Para atingir um equilíbrio entre a usabilidade e a funcionalidade do modelo, o FLUX.1 está disponível em três variantes: FLUX.1 [pro], FLUX.1 [dev] e FLUX.1 [schnell]:
- FLUX.1 [pro]: o melhor do FLUX.1, oferecendo geração de imagens de desempenho de última geração com acompanhamento de dicas, qualidade visual, detalhes de imagem e versatilidade de saída de alto nível. Por API O acesso é concedido mediante o registro do FLUX.1 [pro]. Como alternativa, o FLUX.1 [pro] pode ser acessado por meio do Replicar responder cantando fal.ai Obter. Funcionalidade para pessoas físicas e soluções personalizadas para empresas.
- FLUX.1 [dev]: o FLUX.1 [dev] não é comercial, o FLUX.1 [dev] evoluiu diretamente do FLUX.1 [pro], com qualidade bruta e recursos de atalho semelhantes, sendo mais eficiente do que um modelo padrão do mesmo tamanho, e pode ser usado diretamente no Replicar talvez fal.ai Experimente.
- FLUX.1 [schnell]: em relação aos dois anteriores, é o modelo mais rápido, adaptado para desenvolvimento local e uso pessoal. O FLUX.1 [schnell] está disponível publicamente sob a licença Apache 2.0. O código de inferência pode ser encontrado no diretórioGitHubresponder cantandoDifusores da HuggingFaceEncontrado em.
Acredito que o pacote de modelos FLUX.1 em breve permitirá a integração com o ComfyUI.
2) Observando o gráfico novamente, fica claro que o FLUX.1 [pro] é o mais generativo, mas também o mais caro.
3) A BFL lançou uma comparação de desempenho em seu site, e o FLUX.1 [pro] e [dev] superam o DALL-E 3 (HD), o Midjourney v6.0 e o SD3-Ultra.
Os gráficos de radar representam a comparação de cada modelo em cada uma dessas áreas [qualidade visual], [conformidade de comando], [variabilidade de tamanho/relação de aspecto] e [tipografia e diversidade de saída]. Os três modelos FLUX.1 foram especificamente ajustados para manter a diversidade total de saída do pré-treinamento. A vantagem sobre o estado da arte atual parece ser significativa!Mas o site oficial se vende por si só, basta dar uma olhada nele, em resumo, ele tem muito a oferecer.
4. FLUX.1 Todos os modelos suportam uma ampla gama de proporções e resoluções de 100.000 pixels a 2.000.000 pixels.
Por fim, a BFL afirmou que, com base no pacote de modelagem de texto para vídeo FLUX.1, lançará um sistema de texto para vídeo generativo - SOTA - para todos os cenários de texto para vídeo, que ajudará na criação e edição de mídia com alta clareza, velocidade de geração rápida, qualidade precisa e assim por diante. É muito bom, esperamos ansiosamente por esse dia. É melhor lançar primeiro uma versão de avaliação gratuita e, depois, não torná-la muito cara.