Wan-Move: el marco de código abierto de Ali Tongyi para la generación de vídeo con inteligencia artificial, en colaboración con Tsinghua y otros organismos.
Últimos recursos sobre IAPublicado hace 14 horas Círculo de intercambio de inteligencia artificial 1.5K 00
¿Qué es Wan-Move?
Wan-Move es un marco de generación de vídeo de IA de código abierto desarrollado conjuntamente por Ali Tongyi Labs, la Universidad de Tsinghua y otras instituciones, centrado en la síntesis de vídeo de alta calidad mediante una tecnología precisa de control del movimiento. La tecnología central es la "guía de trayectoria potencial", que puede añadir sin problemas el control de movimiento a nivel de puntos al modelo existente de imagen a vídeo, lo que permite generar vídeos de 5 segundos a 480P, con una precisión de control de movimiento superior a la de la solución de código abierto 22.5%. El marco no necesita modificar la arquitectura del modelo subyacente y consigue la inyección de movimiento copiando las características del primer fotograma a los siguientes, lo que es aplicable a escenarios de un solo objetivo, multiobjetivo y complejos (por ejemplo, interacción multijugador, interacción con objetos). Es aplicable a escenarios de un solo objetivo, multiobjetivo y complejos (por ejemplo, interacción entre varias personas, interacción con objetos), y ha alcanzado un rendimiento máximo de FID 12,2 y EPE 2,6 en las pruebas comparativas MoveBench. Los usuarios pueden probarlo a través del complemento ComfyUI o de la plataforma en la nube, y el modelo se ha publicado en código abierto en GitHub.

Características funcionales de Wan-Move
- Control de movimiento de un solo objetivoControl preciso del movimiento de objetos individuales en el vídeo.
- Control de movimiento multiobjetivo: Admite el control independiente del movimiento de varios objetos en un vídeo.
- Comparación con enfoques académicos y comercialesEl sitio web ofrece comparaciones cualitativas con los métodos académicos y las soluciones comerciales existentes.
- control de cámara: Puede controlar el movimiento de la cámara en vídeo.
- transferencia de locomoción: Es posible transferir movimiento de un vídeo a otro.
- Rotación 3D: Soporte para generar vídeos con efectos de rotación 3D.
Puntos fuertes de Wan-Move
- Control de movimiento de alta calidadLa última incorporación a la gama de sistemas de vídeo es el sistema de vídeo 480p, que produce vídeo de alta calidad, de 5 segundos y 480p, con un control del movimiento comparable al de los sistemas comerciales, satisfaciendo las exigencias de la creación de vídeo profesional.
- No se necesitan módulos adicionalesLa tecnología de codificación de movimiento: no es necesario realizar cambios arquitectónicos en los modelos de imagen a vídeo existentes ni añadir codificadores de movimiento adicionales, lo que reduce la barrera de uso y los costes de desarrollo.
- Control preciso a nivel de puntosControl preciso del movimiento de cada elemento de la escena, lo que permite personalizar el movimiento por regiones para satisfacer las distintas necesidades de las escenas complejas.
- Formación y optimización a gran escalaEl objetivo es garantizar la precisión visual y de movimiento del vídeo generado mediante el entrenamiento con datos a gran escala para mejorar el rendimiento general.
- Apoyo a la evaluación comparativa: Proporciona una evaluación comparativa de MoveBench con muestras a gran escala y anotaciones de trayectorias de alta calidad, lo que facilita la evaluación y comparación de la eficacia de distintos métodos.
- Código abierto y facilidad de uso: El código, las ponderaciones de los modelos y los puntos de referencia son de código abierto, lo que permite a los usuarios iniciarse rápidamente y realizar un desarrollo secundario con una buena escalabilidad y el apoyo de la comunidad.
¿Cuál es la página web oficial de Wan-Move?
- Página web del proyecto:: https://wan-move.github.io/
- Repositorio Github:: https://github.com/ali-vilab/Wan-Move
- Biblioteca de modelos HuggingFace:: https://huggingface.co/Ruihang/Wan-Move-14B-480P
- Documento técnico arXiv:: https://arxiv.org/pdf/2512.08765
Para quién es Wan-Move
- Creadores de vídeoWan-Move: Los profesionales que necesiten crear vídeos animados, con efectos especiales o creativos pueden generar rápidamente contenidos de vídeo con efectos de movimiento específicos.
- Personal de publicidad y marketingPermite crear atractivos vídeos publicitarios para mejorar la promoción de la marca. Es ideal para equipos de marketing que necesitan generar secuencias de vídeo de alta calidad de forma eficaz.
- editor de vídeo: En postproducción de vídeo, se utiliza para ajustar y optimizar rápidamente el contenido de vídeo, como la duplicación del movimiento, el control del movimiento de la cámara, etc., para mejorar la eficacia del trabajo.
- educador: Se utiliza para crear vídeos didácticos que ayudan a los estudiantes a comprender y aprender mejor mediante presentaciones dinámicas, adecuadas para creadores de contenidos en el ámbito educativo.
- desarrollador de juegos: Se utiliza para generar efectos de animación en el juego, como movimientos de personajes, cambios de escena, etc., para mejorar el efecto visual y la experiencia de usuario del juego.
- Investigadores técnicos: Los investigadores interesados en la tecnología de generación de vídeo y control del movimiento pueden investigar y desarrollar con código fuente abierto y pruebas comparativas.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...




