Wie meine Freunde festgestellt haben, erzeugt das kostenlose FLUX-Modell jetzt Bilder, die denen von DALL-E-3 und MJ in nichts nachstehen.
Weiter Controlnet und ipadapter entwickelt, nachdem die freie Kontrolle über den Bildschirm Zusammensetzung Stil und so weiter, DALL-E-3 und MJ im Grunde keinen Vorteil, nur Nachteil.
1. ein Blick auf das Diagramm zeigt, dass FLUX in Bezug auf die ELO-Werte viel weiter fortgeschritten ist.
Die Organisation, die unter dem Akronym BFL (Black Forest Labs Black Forest Labs) bekannt ist, entwickelt fortschrittliche generative Deep-Learning-Modelle für Medien wie Bilder und Videos und setzt sich für die Förderung der Kreativität bei Modellen ein, die die Grenzen der Effizienz und Vielfalt durchbrechen. Erst im August wurde die Veröffentlichung von FLUX.1 Die Model Suite, eine neue Technologie, die Bilddetails, die Einhaltung von Cue-Befehlen, die Stilvielfalt und die Komplexität der Szene für Text-Bild-Compositing definiert.
Um ein Gleichgewicht zwischen Benutzerfreundlichkeit und Modellfunktionalität zu erreichen, ist FLUX.1 in drei Varianten erhältlich: FLUX.1 [pro], FLUX.1 [dev] und FLUX.1 [schnell]:
- FLUX.1 [pro]: Die beste Version von FLUX.1, die hochmoderne, leistungsstarke Bilderzeugung mit erstklassigem Cue-Following, visueller Qualität, Bilddetails und vielseitiger Ausgabe bietet. Von API Der Zugang wird durch die Registrierung von FLUX.1 [pro] gewährt. Alternativ kann der Zugang zu FLUX.1 [pro] auch über die Replizieren Sie im Gesang antworten fal.ai Erhalten. Funktionalitäten für Privatpersonen und maßgeschneiderte Lösungen für Unternehmen.
- FLUX.1 [dev]: FLUX.1 [dev] ist eine nicht-kommerzielle, direkt aus FLUX.1 [pro] entwickelte Version von FLUX.1 [dev], mit ähnlicher Rohqualität und Shortcut-Fähigkeiten, während es effizienter ist als ein Standardmodell der gleichen Größe, und kann direkt auf dem Replizieren Sie vielleicht fal.ai Probieren Sie es an.
- FLUX.1 [schnell]: Im Vergleich zu den beiden vorgenannten ist es das schnellste Modell, das für die lokale Entwicklung und den persönlichen Gebrauch zugeschnitten ist. FLUX.1 [schnell] ist unter der Apache 2.0 Lizenz öffentlich verfügbar. Den Inferenzcode finden Sie in derGitHubim Gesang antwortenHuggingFace's DiffusorenGefunden in.
Ich glaube, dass die FLUX.1 Modellsuite bald die Integration von ComfyUI ermöglichen wird.
2. ein erneuter Blick auf das Diagramm zeigt, dass FLUX.1 [pro] am generativsten, aber auch am teuersten ist.
3 BFL hat auf seiner Website einen Leistungsvergleich veröffentlicht, und FLUX.1 [pro] und [dev] übertreffen DALL-E 3 (HD), Midjourney v6.0 und SD3-Ultra.
Die Radargrafiken zeigen den Vergleich der einzelnen Modelle in jedem dieser Bereiche [visuelle Qualität], [Einhaltung von Befehlen], [Variabilität des Größen-/Seitenverhältnisses] und [Typografie und Ausgabevielfalt]. Die drei FLUX.1-Modelle wurden speziell feinabgestimmt, um die volle Ausgabevielfalt des Vortrainings zu erhalten. Der Vorteil gegenüber dem aktuellen Stand der Technik scheint erheblich zu sein!Aber die offizielle Website verkauft sich von selbst, schauen Sie sie sich einfach an, kurz gesagt, sie hat eine Menge zu bieten.
4 FLUX.1 Alle Modelle unterstützen eine breite Palette von Seitenverhältnissen und Auflösungen von 100.000 bis 2.000.000 Pixel.
Schließlich behauptete BFL, dass es auf der Grundlage der FLUX.1 Text-zu-Video-Modellierungssuite ein generatives Text-zu-Video-System - SOTA - für alle Text-zu-Video-Szenarien auf den Markt bringen wird, das die Erstellung und Bearbeitung von Medien mit hoher Klarheit, schneller Generierungsgeschwindigkeit, präziser Qualität usw. unterstützen wird. Das ist ziemlich gut, wir freuen uns auf diesen Tag, besser wäre es, zuerst eine kostenlose Testversion herauszubringen und sie dann nicht zu teuer zu machen.