WithAnyone - Fudan salto conjunto estrella de código abierto AI modelo de generación de fotos

Últimos recursos sobre IAPublicado hace 4 meses Círculo de intercambio de inteligencia artificial

82.9K 00

¿Qué pasa conAnyone?

WithAnyone es un modelo de generación de fotos de IA desarrollado conjuntamente por la Universidad de Fudan y StepStar, que resuelve el problema habitual de "copiar y pegar" en la generación tradicional de imágenes de IA y consigue una generación de imágenes multipersona más natural y controlable. WithAnyone se basa en la arquitectura del modelo de difusión, que reduce eficazmente los artefactos en las imágenes generadas y mejora la similitud de identidad y la diversidad de la generación. Los usuarios pueden subir fácilmente sus fotos personales para generar fotos de grupo con cualquier persona en distintos escenarios y experimentar efectos de generación de imágenes de IA naturales y realistas.

Principales características de WithAnyone

Generación multi-fotoLa capacidad de mezclar de forma natural a varias personas en una sola foto de grupo, produciendo una imagen discreta.
Mantenimiento de la coherencia de la identidadLa identidad del carácter puede mantenerse mientras se genera la imagen, lo que garantiza que la imagen generada sea muy similar al carácter de entrada.
Ajuste flexible de los detallesEl usuario puede ajustar con flexibilidad los detalles de la expresión, la postura y el peinado del personaje para conseguir una generación de imágenes personalizada.
Reducir los artefactos de "copiar y pegar"El proceso de generación de imágenes AI se basa en tecnología avanzada, que reduce eficazmente el fenómeno habitual de "copiar y pegar" en la generación tradicional de imágenes AI y mejora la calidad de la imagen.
Código abierto y facilidad de usoEl modelo es de código abierto y los usuarios pueden encontrar recursos en Hugging Face para utilizar y experimentar fácilmente la tecnología.

Principios técnicos de WithAnyone

Soporte de conjuntos de datos a gran escalaDatos: se utiliza el conjunto de datos MultiID-2M, que contiene 500.000 fotos de grupos de varias personas y un gran número de imágenes de referencia que abarcan una amplia gama de expresiones, peinados y ángulos, lo que proporciona una rica base de datos para el entrenamiento del modelo.
Formación contrastada sobre la pérdida de identidadEquilibrar la fidelidad de identidad y la diversidad generativa mediante la pérdida de identidad contrastiva (CIL) y el entrenamiento de datos por pares para garantizar que las imágenes generadas mantengan las características de identidad de los personajes y, al mismo tiempo, tengan un efecto visual natural.
Arquitectura del modelo de difusiónLa arquitectura basada en el modelo de difusión reduce eficazmente los artefactos de "copiar y pegar", al tiempo que mantiene una gran similitud de identidad y mejora la calidad general de las imágenes generadas.
código de identidadLa codificación de los rasgos de identidad del personaje garantiza que los atributos únicos del personaje se restauren con precisión durante el proceso de generación para evitar confusiones de identidad.
Optimización multitareaOptimizar simultáneamente múltiples tareas, como el mantenimiento de la identidad, el ajuste de la postura y la fusión del fondo, durante el entrenamiento para mejorar el rendimiento global y la adaptabilidad del modelo.

Dirección del proyecto WithAnyone

Página web del proyecto:: https://doby-xu.github.io/WithAnyone/
Repositorio Github:: https://github.com/Doby-Xu/WithAnyone
Biblioteca de modelos HuggingFace:: https://huggingface.co/WithAnyone/WithAnyone
Documento técnico arXiv:: https://arxiv.org/pdf/2510.14975
Demostración de la experiencia en línea:: https://huggingface.co/spaces/WithAnyone/WithAnyone_demo

A quién va dirigido WithAnyone

usuario de las redes socialesLa tecnología de IA se utilizará para generar fotos de grupo creativas con ídolos, amigos o familiares para compartir en plataformas sociales.
creador de contenidosNecesidad de generar rápidamente fotos de grupo de alta calidad de varias personas para la creación de vídeos, artículos o anuncios.
Diseñador y fotógrafo: para el diseño creativo o el rodaje virtual, explorando nuevas formas de expresión visual.
usuario habitualExperimenta la diversión de la tecnología de IA y crea fotos personalizadas para el entretenimiento y el recuerdo.
Entusiastas de la tecnología y desarrolladores: Investigación sobre técnicas de generación de imágenes de IA, aprendizaje y desarrollo secundario utilizando modelos de código abierto.

Últimos recursos sobre IA

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

WorldFirst: Plataforma de pagos y cobros transfronterizos, cobros transfronterizos para promotores chinos

Últimos recursos sobre IA # AI Servicios abiertos

hace 1 año

0100.6K

Ming-UniAudio - Modelo de generación multimodal de audio unificado de código abierto Ant

Últimos recursos sobre IA

hace 6 meses

034.9K

Tentáculo AI: Herramienta de dibujo AI fácil de usar con soporte para entrenar tu propio estilo de imagen.

Últimos recursos sobre IA # AI generación de imágenes en línea

hace 2 años

059.7K

GLM-4.1V-Thinking - una familia de modelos de lenguaje visual de código abierto de Smart Spectrum AI

Últimos recursos sobre IA

hace 9 meses

046K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

WithAnyone - Fudan salto conjunto estrella de código abierto AI modelo de generación de fotos

¿Qué pasa conAnyone?

Principales características de WithAnyone

Principios técnicos de WithAnyone

Dirección del proyecto WithAnyone

A quién va dirigido WithAnyone

ChatTutor - Ayuda pedagógica de AI de código abierto para visualizar el aprendizaje interactivo

MemOS - Plataforma de código abierto de gestión y programación de la memoria de la IA para compartir recuerdos a largo plazo

Artículos relacionados

WorldFirst: Plataforma de pagos y cobros transfronterizos, cobros transfronterizos para promotores chinos

Ming-UniAudio - Modelo de generación multimodal de audio unificado de código abierto Ant

Tentáculo AI: Herramienta de dibujo AI fácil de usar con soporte para entrenar tu propio estilo de imagen.

GLM-4.1V-Thinking - una familia de modelos de lenguaje visual de código abierto de Smart Spectrum AI

Sin comentarios

Últimas colecciones

Últimos artículos

WithAnyone - Fudan salto conjunto estrella de código abierto AI modelo de generación de fotos

¿Qué pasa conAnyone?

Principales características de WithAnyone

Principios técnicos de WithAnyone

Dirección del proyecto WithAnyone

A quién va dirigido WithAnyone

ChatTutor - Ayuda pedagógica de AI de código abierto para visualizar el aprendizaje interactivo

MemOS - Plataforma de código abierto de gestión y programación de la memoria de la IA para compartir recuerdos a largo plazo

Artículos relacionados

WorldFirst: Plataforma de pagos y cobros transfronterizos, cobros transfronterizos para promotores chinos

Ming-UniAudio - Modelo de generación multimodal de audio unificado de código abierto Ant

Tentáculo AI: Herramienta de dibujo AI fácil de usar con soporte para entrenar tu propio estilo de imagen.

GLM-4.1V-Thinking - una familia de modelos de lenguaje visual de código abierto de Smart Spectrum AI

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos