Vor ein paar Tagen in Künstliche Analyse Das erste Modell Red_Panda (Kleiner Panda) wurde endlich vorgestellt. Das Modell Red_panda ist das neueste Modell zur Bilderzeugung des britischen KI-Startups Recraft AI.Recraft V3.
Dies ist das einzige neue Modell, das Flux in Bezug auf Gewinnrate und Wertung übertrifft. Damals spekulierten viele Leute, ob es sich um ein Modell eines einheimischen Herstellers handelt, da der Name und das Logo viele chinesische Elemente enthalten.
Neuentwurf V3 ist so ziemlich das einzige Modell auf der Welt, das Bilder mit langem Text erzeugen kann, nicht nur mit ein paar Worten wie Flux oder SD3.5.
Seitdem Black Forest Labs unter dem Namen Blueberry anonym eine Bewertung von Flux.1 in der Arena durchgeführt hat, hat auch Recraft.ai gelernt, einen solchen Hype zu betreiben. Sein Ranking-Vergleich auf Artificial Analysis unter dem Namen Red_Panda ein paar Tage vor der Veröffentlichung von Recraft V3 hat alle in einen Rausch der Spekulationen versetzt, um wessen neues Modell es sich handelt.
Derzeit ist Recraft V3 immer noch führend in den Charts des textbasierten Bildmodells für umarmende Gesichter. Dieses Modell ist sehr stark in seiner Fähigkeit, Bilder mit langem Text zu erzeugen. Die Generierung von Bildern mit Text mit MJ, Flux und SD ist höchstens eine Sache von ein paar Wörtern, und mehr als das ist sehr schwierig, während Recraft V3 einfach erdrückend stark in dieser Funktion ist.
Derzeit kann das Red Panda-Modell (Recraft v3) auf der offiziellen Website (recraft) und im Canvas-Client verwendet werden und bietet ein kostenloses Kontingent von 50 Bildern pro Tag.
Recraft V3 ist das einzige Modell der Welt, das Bilder mit langem Text erzeugen kann, nicht nur mit ein paar Worten wie Flux oder SD3.5.
Was sind also die Wunder dieses Modells, das in der Mapping-Welt für Furore sorgt?
01 Langtext-Inhaltskontrolle
Recraft V3 versteht und generiert lange Textinhalte.Es handelt sich nicht nur um ein paar Buchstaben, sondern um einen ganzen Absatz oder sogar einen Artikel!
Diese Art von langem Text ist etwas, das viele Modelle (einschließlich Flux) auch nicht sehr gut verarbeiten können.
Sie können sogar die Dicke der in einem Absatz gerenderten Wörter einstellen und den Text fett drucken lassen.
Es ist einfach OMG, diese Art von Detailkontrolle!
02 Extreme Kontrolle
Recraft V3 ist ein Spitzenprodukt, wenn es um die Kontrolle der Bildstruktur geht.
Sie kann so gestaltet werden, dass sie genau der Platzierung der Elemente im Bild folgt.
Zu den weiteren Neuerungen in Recraft V3 gehören Positionierungssteuerungen und die Generierung von Grafikdesigns, mit denen die genaue Position und Größe von Text in einem Entwurf festgelegt werden kann.
Es ist das Äquivalent zu einem eigenständigen ControlNet, und für Schriftgestalter ist dieses Ding das Äquivalent zu einem Stiefel!
Mit Recraft V3 ist es möglich, Merchandising-Plakate direkt mit Text zu erstellen, was ideal ist, um Marketing-Inhalte direkt zu generieren, und somit ein Glücksfall für Werber.
Und das ist noch nicht alles: Recraft V3 generiert auch eine Reihe von Elementen, die auf dem Stil derDas Modell muss nicht separat trainiert werden↓
Auch die Steuerung von Stilen ist möglich, und der verbesserte Prozess zur Erstellung von Stilen in Recraft V3 ermöglicht ein feinkörniges Experimentieren. Ein Satz von Bildern kann ausgewählt werden, um einen Markenstil zu repräsentieren, und es kann mit den Kandidatenstilen experimentiert werden, bis sie genau auf das von der Marke geforderte Erscheinungsbild abgestimmt sind.Recraft V3 akzeptiert Stile als Input für das Modell und erfordert nicht, dass das Modell neu trainiert wird, um die Details des Stils zu erfassen. Es können zahlreiche periphere Elemente und visuelle VIs erstellt werden.
03 Überlegene Karosserieform und Ästhetik
Ein weiterer Aspekt der Stärken von Recraft V3 wird offiziell als anatomische Korrektheit angepriesen. Anatomische Korrektheit ist ein Indikator für die Auswahl des Modells, das die genaueste anatomische Struktur erzeugt und die richtige Anzahl von Fingern, Händen und Beinen, realistische Körperproportionen, räumliche Kohärenz innerhalb der Szene und die natürliche Positionierung von Hintergrundobjekten in Bezug auf das Hauptmotiv gewährleistet.Recraft V3 ist darauf ausgerichtet, Bilder mit korrekter anatomischer Struktur zu erzeugen. Räumliche Kohärenz innerhalb der Szene und natürliche Positionierung von Hintergrundobjekten im Verhältnis zum Hauptmotiv.
Die Integrität der Gliedmaßen ist eine Richtung, die Midjourney optimiert hat, und das Ergebnis ist, dass die Menschen"Blau ist besser als blau.
Recraft V3 erzeugt Bilder mit komplexen ästhetischen Szenen, einschließlich der korrekten Anzahl, Farbe und Position der im Hinweis genannten Objekte.
Ich fürchte, Midjourney wird jetzt mit den Stiefeln wackeln, ob es nun um Ästhetik, Geschwindigkeit oder Preise geht, Recraft ist wettbewerbsfähiger als MJ...
Derzeit haben kostenlose Nutzer täglich50 BlätterBildquote