前几天在 Artificial Analysis 排第一的 Red_Panda (小熊猫)神秘文生图模型终于被认领了,Red_panda模型实为英国人工智能初创公司Recraft AI推出的最新图像生成模型Recraft V3。
这是唯一一个胜率和评分居然都碾压Flux的新模型,当时因为其名称和Logo带有很多中国元素,不少人猜测是不是国内厂家模型。
Recraft V3算是目前全球唯一一个能够生成带有长文本图像的模型,不仅仅是像Flux或SD3.5那样几个单词。
自从Black Forest Labs在竞技场以蓝莓为名,匿名进行Flux.1的评测后,Recraft.ai也学会了进行这样的炒作。其在Recraft V3发布前几天在Artificial Analysis上以Red_Panda为名进行排名对比,让大家疯狂猜测究竟是谁家的新模型。
目前,Recraft V3在抱抱脸的文生图模型排行榜上仍处于领先地位。这个模型在生成带长文本的图像的能力上非常强。用MJ、Flux、SD生成带文本的图像,最多就几个单词,多了就很难成功,而Recraft V3在此功能上简直是碾压性地强。
目前,小熊猫模型(Recraft v3)已经在官网( recraft )和Canvas客户端开放了使用,并且每日免费50张图片额度。
Recraft V3算是目前全球唯一一个能够生成带有长文本图像的模型,不仅仅是像Flux或SD3.5那样几个单词。
那么,这个轰动整个绘图界的模型,究竟有哪些神通呢?
01 长文本内容控制
Recraft V3能够理解并且生成长文本内容,这可不是随随便便几个字母,而是一大段话甚至一篇文章!
这种长文本是很多模型(包括Flux)也无法很好处理的。
甚至可以控制段落中单词呈现的粗细,可以将文本设置成粗体~
简直OMG了,这种细节控制力!
02 极致的控制
Recraft V3在图片结构的控制堪称顶尖。
它可以完全依照图片中元素的安置方式来进行设计。
Recraft V3其他创新包括定位控制和图形设计生成,允许指定设计上文本的精确位置和大小。
这相当于是自带ControlNet,对字体设计师来说,这玩意等于开挂!
并且还能直接与图像进行结合设计,有了Recraft V3,可以直接生成带文字的商品海报,非常适合用来直接生成营销内容,对于广告从业人员来说,这是个神器。
还没完,Recraft V3还能根据风格生成一系列的元素,不需要再单独训练模型↓
此外还能进行样式控制,Recraft V3改进的风格创建过程允许进行细粒度的实验。可以选择一组图像来代表品牌风格,并对候选风格进行实验,直到其调整为品牌所需的确切外观和感觉。Recraft V3 接受风格作为模型的输入,并且不需要重新训练模型来捕捉风格的细节。可以生产出许多的周边元素和视觉VI。
03 优异的肢体剖析和美学
在生成人物上也非常强,官方宣传称Recraft V3的另一方面优势在解剖正确性。解剖正确性是选择生成最准确解剖结构的模型的指标,确保手指、手和腿的数量适当、身体比例逼真、场景内的空间连贯性以及背景物体相对于主要主体的自然定位。Recraft V3 经过调整,可生成具有正确解剖结构的图像。场景中的空间连贯性以及背景对象相对于主要主题的自然定位。
肢体完整度是Midjourney一直在优化的方向,结果人家青出于蓝而胜于蓝~
提示词遵循性方面也不错,Recraft V3 可以生成具有复杂美学场景的图像,包括提示中提到的物体的正确数量、颜色和位置。
这下Midjourney恐怕要瑟瑟发抖了,不管是美学还是速度还是定价,Recraft都比MJ要有竞争力...
目前免费用户每日有50张图片额度