Wir freuen uns, heute Folgendes veröffentlichen zu können FLUX.1 WerkzeugeDies ist eine Modellsuite, die dazu dient, unser grundlegendes textgeneriertes Bildmodell FLUX.1 zu kontrollieren und zu steuern, um die Modifizierung und Neuerstellung von realen und generierten Bildern zu unterstützen. Zum Zeitpunkt der Veröffentlichung ist dasFLUX.1 Werkzeuge Enthält vier einzigartige Funktionen, die als Open-Access-Modelle in der FLUX.1 [dev]-Familie sowie in der BFL-API für FLUX.1 [pro] verfügbar sein werden:
- FLUX.1 Füllen: Moderne Modelle zur Bildwiederherstellung (Inpainting) und -erweiterung (Outpainting), die reale oder generierte Bilder auf der Grundlage von Textbeschreibungen und binären Masken bearbeiten und erweitern können.
- FLUX.1 Tiefe: Ein Modell für strukturierte Führung durch Extraktion von Tiefenkarten und Textinformationen aus Eingabebildern.
- FLUX.1 Canny: Ein Modell für die strukturierte Führung durch Extraktion von Canny-Kanten und textlichen Hinweisen aus dem Eingangsbild.
- FLUX.1 Redux: Ein Adapter, der das Mischen und Wiederherstellen von Eingabebildern und Texteingaben unterstützt.
Diese Veröffentlichung unterstreicht unser doppeltes Engagement, die Forschungsgemeinschaft mit hochmodernenOffene Gewichtungsmodelle bei gleichzeitiger Bereitstellung erstklassiger Funktionen über APIs. Wir veröffentlichen in der BFL-API für jedes Werkzeug die FLUX.1 [pro] Version, wobei Inferenzcodes und Gewichte als offener Zugang zur Verfügung gestellt werden, um die Destillation zu leiten FLUX.1 [dev] Version. Darüber hinaus freuen wir uns, Ihnen mitteilen zu können, dass die von uns herausgegebenen Modelle über die folgenden Partner erhältlich sein werden:fal.ai, undReplizieren Sie, undGemeinsam.ai, undFreepik im Gesang antworten krea.ai.
Die folgenden Abschnitte enthalten detaillierte Informationen über die neuen Modelle, Leistungsanalysen und Anleitungen für den Zugang zu ihnen. Wir freuen uns darauf, das lebendige Flux-Ökosystem durch diese neuen Tools weiter zu verbessern.
Bildwiederherstellung und Erweiterung mit FLUX.1 Fill
FLUX.1 Fill bietet erweiterte Bildwiederherstellung (Inpainting) Fähigkeiten, die über die bestehenden Tools hinausgehen, wie Ideogramm 2.0 und beliebte Open-Source-Tools wie das von AlimamaCreative FLUX-Kontrollnetz-Malerei. Es bearbeitet Bilder nahtlos und fügt sich natürlich in vorhandene Bilder ein.
Darüber hinaus unterstützt FLUX.1 Fill die Bilderweiterung (Outpainting)Der Benutzer kann das Bild über die ursprünglichen Grenzen hinaus erweitern.
Wir haben einen Benchmark-Test mit öffentlich zugänglichen hier sind. Die Ergebnisse zeigen, dass Flux.1 Fill [pro] alle anderen konkurrierenden Methoden übertrifft und das bisher fortschrittlichste Modell zur Bildwiederherstellung ist. Es wird gefolgt von Flux.1 Fill [dev], das in Bezug auf die Inferenz-Effizienz die proprietären Lösungen übertrifft.
Flux.1 Fill [dev] wird unter der Flux-Entwicklungslizenz bereitgestellt und enthält Folgendes:
- Vollständige Modellgewichte auf Hugging Face verfügbar: [Füllen Sie]
- Den Inferenzcode finden Sie in der Datei GitHub gewinnen
Flux.1 Füllen [pro] Verfügbar unter [**]BFL API**] verwendet wird.
Strukturelle Konditionierung mit Canny / Depth für FLUX.1
Die strukturelle bedingte Kontrolle ermöglicht eine präzise Steuerung des Bildtransformationsprozesses durch die Canny-Kantenerkennung oder Tiefenerkennung. Indem die Struktur des Originalbildes durch Kanten- oder Tiefenkarten erhalten bleibt, können Benutzer textgesteuerte Bearbeitungen vornehmen, ohne dass die Kernkomposition beeinträchtigt wird. Dieser Ansatz ist besonders effektiv bei der Retexturierung von Bildern.
In unserer Bewertung (zum Benchmarking siehe hier sind).FLUX.1 Tiefe Die Leistung ist besser als Midjourney proprietäre Modelle wie ReTexture. Insbesondere FLUX.1 Tiefe [pro] bietet eine größere Vielseitigkeit bei der Ausgabe, während die FLUX.1 Tiefe [dev] gleichmäßigere Leistung bei Aufgaben der Tiefenwahrnehmung. Benchmarks für das Canny-Kantenmodell finden Sie unter hier sind(math.) GattungFLUX.1 Canny [pro] als das beste Modell, gefolgt von FLUX.1 Canny [dev].
FLUX.1 Canny / Depth ist in zwei Versionen erhältlich: das vollständige Modell für maximale Leistung und eine LoRA-Version, die auf FLUX.1 [dev] basiert und die Entwicklung erleichtert.
Flux Depth / Canny [dev] ist unter der Flux Dev-Lizenz erhältlich:
- Die vollständigen Modellgewichte sind bei Hugging Face erhältlich:[Tiefe] [Geschickt]
- LoRA-Gewichte sind bei Hugging Face erhältlich:[Tiefe] [Geschickt]
- Auf den Inferenzcode kann über die Funktion GitHub gewinnen
Flux.1 Depth / Canny [pro] kann übernommen werden von BFL-API Erhalten.
Bildvariationen und Stilisierung mit FLUX.1 Redux
FLUX.1 Redux ist ein Adapter für alle FLUX.1 Basismodelle zur Erzeugung von Bildvarianten. Mit dem Eingabebild kann FLUX.1 Redux Bilder mit leichten Variationen reproduzieren und so ein gegebenes Bild optimieren.
Es lässt sich ganz natürlich in komplexere Arbeitsabläufe integrieren und ermöglicht die Bildstilisierung durch Schlagwörter. Über unsere API können Benutzer Bilder und Stichwörter bereitstellen, um die Stilisierung abzuschließen. Diese Funktion ist in unserer neuesten Version verfügbar FLUX 1.1 [pro] Ultra Das Modell ist in der Lage, Eingabebilder und Texteingaben zu kombinieren, um hochwertige 4-Megapixel-Ausgaben mit flexiblen Seitenverhältnissen zu erzeugen.
unser Benchmarking zeigt, dass FLUX.1 Redux die beste Leistung bei der Erzeugung von Bildvarianten erreicht.
Flux.1 Redux [dev] ist unter der Flux Dev Lizenz verfügbar:
- Modellgewichte können von Hugging Face bezogen werden: [Redux]
- Auf den Inferenzcode kann über die Funktion GitHub gewinnen
Flux.1 Redux, das FLUX1.1 [pro] Ultra unterstützt, ist verfügbar über die BFL-API Erhalten.
Wir freuen uns darauf, dass die Gemeinschaft mit Hilfe unseres neuen Instrumentariums weitere Ideen entwickelt. Der Zugang dazu ist möglich über [api.bfl.mlTesten Sie unsere API.