私の仲間が検証したように、フリーのFLUXモデルはDALL-E-3やMJに劣らない画像を生成するようになった。
次に開発されたControlnetとipadapterは、画面構成スタイルなどを自由にコントロールできるため、DALL-E-3とMJには基本的にメリットがなく、デメリットしかない。
1.まずグラフを見ると、ELOのレーティングスコアではFLUXの方がはるかに進んでいることがわかる。
BFL(Black Forest Labs ブラックフォレストラボ)の頭文字で知られるこの組織は、画像や動画などのメディア向けの先進的な生成ディープラーニングモデルを再開発・進化させ、効率性と多様性の境界を打ち破るモデルの創造性を刺激することを推し進める組織である。8月にリリースされたばかりの フラックス.1 モデル・スイートは、テキストから画像への合成のために、画像の詳細、キュー・コマンドの順守、スタイルの多様性、シーンの複雑性を定義する新技術である。
FLUX.1には、ユーザビリティとモデル機能のバランスを取るために、FLUX.1 [pro]、FLUX.1 [dev]、FLUX.1 [schnell]の3つのバリエーションがあります:
- FLUX.1[pro]:FLUX.1の最高峰。一流のキュー・フォロー、ビジュアル・クオリティ、画像のディテール、出力の多様性を備えた最先端のパフォーマンス画像生成を提供。発売元 API FLUX.1[pro]を登録することでアクセスが許可されます。また、FLUX.1 [pro]へのアクセスは 複製 歌で応える ファルアイ 手に入れる。個人向けの機能性と企業向けのカスタマイズされたソリューション。
- FLUX.1 [dev]: FLUX.1[dev]は、FLUX.1[pro]から直接進化した非商用のFLUX.1[dev]であり、同じサイズの標準モデルよりも効率的でありながら、同様の生品質とショートカット機能を備えており、FLUX.1[dev]上で直接使用することができます。 複製 もしかしたら ファルアイ 着てみて
- FLUX.1[schnell]:上記の2つに比べ、最も高速なモデルで、ローカル開発や個人的な使用に適している。推論コードはギットハブ歌で応えるハギング・フェイスのディフューザーで発見された。
FLUX.1のモデルスイートでは、まもなくComfyUIとの統合が可能になると思います。
2.グラフをもう一度見ると、FLUX.1 [pro]が最も生成的であることは明らかだが、最も高価でもある。
3.BFLはウェブサイトで性能比較を発表していますが、FLUX.1 [pro]と[dev]はDALL-E 3 (HD)、Midjourney v6.0、SD3-Ultraを上回っています。
レーダーチャートは、これらの各分野[ビジュアル品質]、[コマンドコンプライアンス]、[サイズ/アスペクト比のばらつき]、および[タイポグラフィと出力の多様性]における各モデルの比較を表しています。3つのFLUX.1モデルは、事前トレーニングの出力の多様性を完全に維持するために特別に微調整されました。現在の最先端技術に対する優位性は大きいと思われる!しかし、公式ウェブサイトはそれ自体が売り物である。
4.FLUX.1全モデルで10万画素から200万画素までの幅広いアスペクト比と解像度に対応。
最後にBFLは、FLUX.1テキストからビデオへのモデリング・スイートをベースに、あらゆるテキストからビデオへのシナリオに対応するジェネレーティブ・テキストからビデオへのシステム-SOTA-を発表し、高い明瞭度、速い生成速度、正確な品質などでメディアの作成と編集を支援すると主張している。まずは無料トライアルを実施し、あまり高価にならないようにしてほしい。