LongCat-Video-Avatar - Modelo de generación de vídeo avatar de código abierto de Meituan
LongCat-Video-Avatar es un modelo avanzado de generación de vídeo basado en audio, creado a partir de LongCat-Video de código abierto por Meituan, que se centra en la generación de vídeos largos hiperrealistas y sincronizados con los labios, con una dinámica natural y una identidad coherente.
MiMo-V2-Flash - Un gran modelo de la arquitectura MoE de código abierto lanzado por Xiaomi
MiMo-V2-Flash es un gran modelo de arquitectura MoE de código abierto lanzado por Xiaomi, con 309.000 millones de parámetros totales y 15.000 millones de parámetros activos, centrado en el razonamiento eficiente y las aplicaciones corporales inteligentes. El modelo adopta una arquitectura de atención híbrida y tecnología de meta-predicción multi-palabra, con una velocidad de inferencia de 150 tokens/segundo, en...
Nemotron 3 - Una familia de modelos de IA de código abierto publicada por NVIDIA
Nemotron 3 es una familia de modelos de IA de código abierto lanzada por NVIDIA en tamaños Nano, Super y Ultra. Nemotron 3 adopta una arquitectura MoE latente que mejora significativamente la eficiencia de la inferencia y reduce los costes operativos. Entre ellos...
Wan-Move: el marco de código abierto de Ali Tongyi para la generación de vídeo con inteligencia artificial, en colaboración con Tsinghua y otros organismos.
Wan-Move es un marco de generación de vídeo de IA de código abierto desarrollado conjuntamente por Ali Tongyi Labs, la Universidad de Tsinghua y otras instituciones, centrado en la composición de vídeo de alta calidad mediante una tecnología precisa de control del movimiento. La tecnología central es la "guía de trayectoria potencial", que puede añadir sin problemas el control de movimiento a nivel de punto al modelo existente de imagen a vídeo...
PaCoRe - Marco de razonamiento colaborativo paralelo de StepStar para la Inteligencia Artificial
PaCoRe (Parallel Coordinated Reasoning) es el innovador marco de razonamiento colaborativo paralelo de código abierto de StepFun, a través de un mecanismo de pensamiento masivamente paralelo, desde múltiples perspectivas para explorar simultáneamente la solución del problema, rompiendo...
Banana Slides - Herramienta de generación de PPT de AI de código abierto basada en el modelo Nano Banana Pro.
Banana Slides es un generador inteligente de PPT de código abierto basado en el modelo Nano Banana Pro AI, que permite crear rápidamente presentaciones profesionales utilizando comandos de lenguaje natural. Permite a los usuarios describir el tema en una frase (por ejemplo, "Impacto humano en el ecosistema"), que puede ser auto...
Kaleido - Un modelo de generación de vídeo de referencia multisujeto de código abierto creado por Smart Spectrum AI en colaboración con la Universidad de Tsinghua y otras instituciones.
Kaleido es un modelo de generación de vídeo de referencia multisujeto de código abierto desarrollado conjuntamente por la Universidad Tecnológica de Hefei, la Universidad de Tsinghua y Smart Spectrum AI. Genera vídeos coherentes con el sujeto a través de múltiples imágenes de referencia, resolviendo las deficiencias de los modelos existentes en cuanto a coherencia multisujeto y desacoplamiento del fondo.Kaleido genera vídeos a través de un...
Paper2Slides - La Universidad de Hong Kong convierte documentos académicos de código abierto en diapositivas Herramientas de IA
Paper2Slides es una herramienta de IA de código abierto del Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong que convierte documentos académicos en diapositivas o pósters profesionales en un solo clic. Utiliza la tecnología RAG (Retrieval Augmented Generation), analizando directamente el contenido del documento en lugar de basarse en información de la red, para garantizar que el PPT generado sea altamente coherente con el original....
RealVideo - Sistema de generación de vídeo en tiempo real de código abierto de Wisdom Spectrum AI
RealVideo es un sistema de generación de vídeo en tiempo real de código abierto de Smart Spectrum AI que puede generar rápidamente respuestas de vídeo naturales y fluidas en 2 o 3 segundos. Los usuarios solo tienen que subir una foto e introducir un texto, y el sistema genera la voz y el vídeo correspondientes, lo que permite dialogar en tiempo real con personajes de IA....
OpenScreen - Herramienta de grabación de pantalla gratuita y de código abierto para Mac y Windows.
OpenScreen es una herramienta de grabación de pantalla de código abierto y gratuita que proporciona a los usuarios una alternativa fácil de usar y funcional a Screen Studio. Es compatible tanto con Mac como con Windows, es totalmente gratuita y sigue el protocolo del MIT, y puede utilizarse para grabaciones individuales de...








