WithAnyone - Fudan salto conjunto estrella de código abierto AI modelo de generación de fotos
Últimos recursos sobre IAPublicado hace 2 meses Círculo de intercambio de inteligencia artificial 24.7K 00
¿Qué pasa conAnyone?
WithAnyone es un modelo de generación de fotos de IA desarrollado conjuntamente por la Universidad de Fudan y StepStar, que resuelve el problema habitual de "copiar y pegar" en la generación tradicional de imágenes de IA y consigue una generación de imágenes multipersona más natural y controlable. WithAnyone se basa en la arquitectura del modelo de difusión, que reduce eficazmente los artefactos en las imágenes generadas y mejora la similitud de identidad y la diversidad de la generación. Los usuarios pueden subir fácilmente sus fotos personales para generar fotos de grupo con cualquier persona en distintos escenarios y experimentar efectos de generación de imágenes de IA naturales y realistas.

Principales características de WithAnyone
- Generación multi-fotoLa capacidad de mezclar de forma natural a varias personas en una sola foto de grupo, produciendo una imagen discreta.
- Mantenimiento de la coherencia de la identidadLa identidad del carácter puede mantenerse mientras se genera la imagen, lo que garantiza que la imagen generada sea muy similar al carácter de entrada.
- Ajuste flexible de los detallesEl usuario puede ajustar con flexibilidad los detalles de la expresión, la postura y el peinado del personaje para conseguir una generación de imágenes personalizada.
- Reducir los artefactos de "copiar y pegar"El proceso de generación de imágenes AI se basa en tecnología avanzada, que reduce eficazmente el fenómeno habitual de "copiar y pegar" en la generación tradicional de imágenes AI y mejora la calidad de la imagen.
- Código abierto y facilidad de usoEl modelo es de código abierto y los usuarios pueden encontrar recursos en Hugging Face para utilizar y experimentar fácilmente la tecnología.
Principios técnicos de WithAnyone
- Soporte de conjuntos de datos a gran escalaDatos: se utiliza el conjunto de datos MultiID-2M, que contiene 500.000 fotos de grupos de varias personas y un gran número de imágenes de referencia que abarcan una amplia gama de expresiones, peinados y ángulos, lo que proporciona una rica base de datos para el entrenamiento del modelo.
- Formación contrastada sobre la pérdida de identidadEquilibrar la fidelidad de identidad y la diversidad generativa mediante la pérdida de identidad contrastiva (CIL) y el entrenamiento de datos por pares para garantizar que las imágenes generadas mantengan las características de identidad de los personajes y, al mismo tiempo, tengan un efecto visual natural.
- Arquitectura del modelo de difusiónLa arquitectura basada en el modelo de difusión reduce eficazmente los artefactos de "copiar y pegar", al tiempo que mantiene una gran similitud de identidad y mejora la calidad general de las imágenes generadas.
- código de identidadLa codificación de los rasgos de identidad del personaje garantiza que los atributos únicos del personaje se restauren con precisión durante el proceso de generación para evitar confusiones de identidad.
- Optimización multitareaOptimizar simultáneamente múltiples tareas, como el mantenimiento de la identidad, el ajuste de la postura y la fusión del fondo, durante el entrenamiento para mejorar el rendimiento global y la adaptabilidad del modelo.
Dirección del proyecto WithAnyone
- Página web del proyecto:: https://doby-xu.github.io/WithAnyone/
- Repositorio Github:: https://github.com/Doby-Xu/WithAnyone
- Biblioteca de modelos HuggingFace:: https://huggingface.co/WithAnyone/WithAnyone
- Documento técnico arXiv:: https://arxiv.org/pdf/2510.14975
- Demostración de la experiencia en línea:: https://huggingface.co/spaces/WithAnyone/WithAnyone_demo
A quién va dirigido WithAnyone
- usuario de las redes socialesLa tecnología de IA se utilizará para generar fotos de grupo creativas con ídolos, amigos o familiares para compartir en plataformas sociales.
- creador de contenidosNecesidad de generar rápidamente fotos de grupo de alta calidad de varias personas para la creación de vídeos, artículos o anuncios.
- Diseñador y fotógrafo: para el diseño creativo o el rodaje virtual, explorando nuevas formas de expresión visual.
- usuario habitualExperimenta la diversión de la tecnología de IA y crea fotos personalizadas para el entretenimiento y el recuerdo.
- Entusiastas de la tecnología y desarrolladores: Investigación sobre técnicas de generación de imágenes de IA, aprendizaje y desarrollo secundario utilizando modelos de código abierto.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...




