El modelo FLUX gratuito genera imágenes que ya no tienen nada que envidiar a DALL-E-3, Midjourney o Stable Diffusion.
Como han comprobado mis compañeros, el modelo FLUX libre genera ahora imágenes que no tienen nada que envidiar a DALL-E-3 y MJ.
Siguiente Controlnet y ipadapter desarrollado después de que el libre control del estilo de composición de la pantalla y así sucesivamente, DALL-E-3 y MJ básicamente ninguna ventaja, sólo desventaja.
1. Si nos fijamos primero en el gráfico, está claro que FLUX está mucho más avanzado en términos de puntuación de ELO.

La organización, conocida por su acrónimo BFL (Black Forest Labs Black Forest Labs), es una organización que redesarrolla y avanza modelos avanzados de aprendizaje profundo generativo para medios como imágenes y vídeo, y empuja para estimular la creatividad en modelos que rompen los límites de la eficiencia y la diversidad. Justo en agosto, el lanzamiento de FLUX.1 El conjunto de modelos, que es una nueva tecnología que define el detalle de la imagen, el cumplimiento de las órdenes de pista, la variedad de estilos y la complejidad de la escena para la composición de texto a imagen.
Para lograr un equilibrio entre facilidad de uso y funcionalidad del modelo, FLUX.1 está disponible en tres variantes: FLUX.1 [pro], FLUX.1 [dev] y FLUX.1 [schnell]:
- FLUX.1 [pro]: Lo mejor de FLUX.1, que ofrece la generación de imágenes de rendimiento más avanzada con seguimiento de pistas, calidad visual, detalle de imagen y versatilidad de salida de primera categoría. En API El acceso se concede mediante el registro de FLUX.1 [pro]. Alternativamente, se puede acceder a FLUX.1 [pro] a través de la página Replicar responder cantando fal.ai Conseguir. Funcionalidad para particulares y soluciones personalizadas para empresas.
- FLUX.1 [dev]: FLUX.1 [dev] es un modelo no comercial, FLUX.1 [dev] evolucionó directamente de FLUX.1 [pro], con una calidad bruta y capacidades de atajo similares, a la vez que es más eficiente que un modelo estándar del mismo tamaño, y puede usarse directamente en el Replicar tal vez fal.ai Pruébatelo.
- FLUX.1 [schnell]: en relación con los dos anteriores, es el modelo más rápido, adaptado para el desarrollo local y el uso personal.FLUX.1 [schnell] está disponible públicamente bajo la licencia Apache 2.0. El código de inferencia se encuentra en elGitHubresponder cantandoDifusores de HuggingFaceEncontrado en.
Creo que el conjunto de modelos FLUX.1 pronto permitirá la integración de ComfyUI.
2. Observando de nuevo el gráfico, queda claro que FLUX.1 [pro] es el más generativo, pero también el más caro.

3. BFL ha publicado una comparación de rendimiento en su sitio web, y FLUX.1 [pro] y [dev] superan a DALL-E 3 (HD), Midjourney v6.0 y SD3-Ultra.
Los gráficos de radar representan la comparación de cada modelo en cada una de estas áreas [calidad visual], [cumplimiento de órdenes], [variabilidad de la relación tamaño/aspecto], y [tipografía y diversidad de salida].Los tres modelos FLUX.1 se ajustaron específicamente para mantener toda la diversidad de salida del preentrenamiento. La ventaja sobre el estado actual de la técnica parece significativa.Pero el sitio web oficial se vende solo, basta con echarle un vistazo, en resumen, tiene mucho que ofrecer.

4. FLUX.1 Todos los modelos admiten una amplia gama de relaciones de aspecto y resoluciones de 100.000 píxeles a 2.000.000 de píxeles.

Por último, BFL afirmó que, basándose en la suite de modelado de texto a vídeo FLUX.1, lanzará un sistema generativo de texto a vídeo -SOTA- para todos los escenarios de texto a vídeo, que ayudará a la creación y edición de medios con gran claridad, rápida velocidad de generación, calidad precisa, etc. Está muy bien, esperamos con impaciencia que llegue ese día, mejor que saquen primero una versión de prueba gratuita, y luego que no sea demasiado caro.
© declaración de copyright
文章版权归 Círculo de intercambio de inteligencia artificial 所有,未经允许请勿转载。
Artículos relacionados
Sin comentarios...