经过小伙伴们的验证,现在免费的FLUX模型生成的图片已经不输DALL·E-3和MJ了。
下一步Controlnet和ipadapter开发出来以后,可以自由控制画面构图风格之类的,DALL·E-3和MJ基本没啥优势,只有劣势。
1. 先看这张图,ELO等级分数很明显FLUX要更靠前。
这个组织简称BFL(Black Forest Labs 黑森林实验室),它一只再开发和推进用于图像和视频等媒体的先进生成式深度学习模型,并推动激发模型创造力,打破效率和多样性的界限。就在8月,发布了 FLUX.1 模型套件,该套件是定义了文本到图像合成的图像细节、提示指令遵循性、样式多样性和场景复杂性的新技术。
为了在可用性和模型功能之间取得平衡,FLUX.1 有三种变体:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]:
- FLUX.1 [pro]:FLUX.1 的佼佼者,提供最先进的性能图像生成,具有顶级的提示跟随、视觉质量、图像细节和输出多样性。通过 API 注册 FLUX.1 [pro] 即可获得访问权限。另外FLUX.1 [pro] 也可通过 Replicate 和 fal.ai 获得。为个人提供功能,为企业提供定制化解决方案。
- FLUX.1 [dev]:FLUX.1 [dev] 是一个非商业化的,FLUX.1 [dev] 直接从 FLUX.1 [pro] 演化而来,具有相似的生图质量和快捷能力,同时比相同尺寸的标准模型效率更高,可以直接在 Replicate 或 fal.ai 上试用。
- FLUX.1 [schnell]:相对以上两款,它是速度最快的模型,是为本地开发和个人使用量身定制的。FLUX.1 [schnell] 在 Apache2.0 许可下公开可用。推理代码可以在GitHub和HuggingFace的Diffusers中找到。
相信FLUX.1 模型套件很快就会实现 ComfyUI 集成。
2. 再看这张图,很明显 FLUX.1 [pro] 生成能力最强,但成本也最高。
3. BFL在官网放出了性能对比,FLUX.1 [pro] 和 [dev] 超越了 DALL·E 3 (HD)、Midjourney v6.0、SD3-Ultra 。
雷达图分别表示了各个模型在【视觉质量】、【指令遵从】、【大小/纵横比可变性】、【排版和输出多样性】这些方面的对比。FLUX.1三个模型经过专门微调,以保持预训练的全部输出多样性。与当前最先进的技术相比,似乎优势很大!但官网自卖自夸嘛,看看就可以了,总之的确有过人之处。
4. FLUX.1 所有型号都支持10万像素到200万像素的各种纵横比和分辨率生图。
最后BFL声称,会在 FLUX.1 文生图模型套件的基础上,推出生成式文本转视频系统-SOTA,面向所有的文本转视频场景,将以清晰度高、生成速度快、品质精确等等特点,辅助媒体创作和编辑。挺好的,我们期待那一天,最好出来先免费试用,然后不要搞得太贵。。。