Intern-S1-mini - Modelo científico multimodal ligero de código abierto de Shanghai AI Lab
Intern-S1-mini es un macromodelo científico multimodal ligero con una escala de parámetros de 8B lanzado por el Laboratorio de Inteligencia Artificial de Shanghai (SAL).Hereda las potentes capacidades de Intern-S1, combinando tanto capacidades de propósito general como científicas especializadas, y es adecuado para un despliegue rápido y un desarrollo secundario. En términos de rendimiento, I...
Nano Banana - Modelo de edición de imágenes con inteligencia artificial de Google
Nano Banana es el nombre en clave de Gemini 2.5 Flash Image para Gemini, un modelo de generación y edición de imágenes AI de Google que genera imágenes detalladas y fotorrealistas basadas en simples indicaciones de texto para realizar modificaciones de alta calidad en imágenes existentes.
Genie Envisioner: la plataforma robótica de código abierto de uso general de Jiyuan con Beihang y otras entidades
Genie Envisioner (GE) es una plataforma unificada para operaciones robóticas desarrollada por el equipo de Genie Robotics en colaboración con la Universidad Nacional de Singapur, la Universidad de Aeronáutica y Astronáutica de Pekín y otras instituciones. Permite a los robots comprender y realizar mejor las tareas "imaginando primero y actuando después".
DINOv3 - Modelo base de visión autosupervisada de próxima generación de Meta AI
DINOv3 es un modelo base de visión autosupervisada de próxima generación de Meta AI que utiliza un paradigma de aprendizaje autosupervisado para aprender características de imágenes sin datos de etiquetado. Resuelve el problema de la degradación de características mejorando la preparación de los datos e introduciendo el anclaje Gram, y mejora la generalización....
Matrix-Game 2.0 - Modelo de mundo interactivo desarrollado por KunlunWei
Matrix-Game 2.0 es un modelo de mundo interactivo desarrollado por Kunlun SkyWork AI. Matrix-Game 2.0 es el primer modelo de generación interactiva de secuencias largas, en tiempo real y de código abierto de la industria para escenarios de uso general, capaz de funcionar a 25 FPS en múltiples...
Baichuan-M2 - Baichuan Intelligence lanza un gran modelo mejorado de código abierto para la sanidad
Baichuan-M2 es un macromodelo médico aumentado de código abierto lanzado por Baichuan Intelligence. Tiene un buen rendimiento en el ámbito médico, especialmente en la revisión de HealthBench con una puntuación de 60,1, superando al gpt-oss120b de OpenAI y a muchos otros modelos de código abierto, y convirtiéndose en un...
Qwen-Flash - Un modelo lingüístico de alto rendimiento y bajo coste de Tongyi Chien-quan
Qwen-Flash es un modelo lingüístico de alto rendimiento y bajo coste introducido en la serie Alibaba Tongyi Thousand Questions, diseñado para una respuesta rápida y un procesamiento eficiente de tareas sencillas. Basado en la arquitectura avanzada Mixture-of-Experts (MoE), se realiza mediante una red dispersa de expertos....
SkyReels-A3 - Herramienta de creación humana digital basada en audio de KunlunWangwei
SkyReels-A3 es una herramienta de creación humana digital basada en audio de Kunlun World Wide Group. SkyReels-A3 es una herramienta de creación humana digital basada en audio que puede generar contenidos de vídeo dinámicos de alta calidad a partir de entradas sencillas (por ejemplo, imágenes de retratos y voz), hacer que fotos estáticas "cobren vida" y sustituir líneas de vídeos existentes por nuevas sincronizaciones labiales que los personajes...
MiniMax Speech 2.5 - Modelo de generación de voz de MiniMax
MiniMax Speech 2.5 es un modelo avanzado de generación del habla desarrollado por el equipo MiniMax. Supone un avance significativo en el campo de la síntesis del habla, especialmente en términos de expresividad multilingüe, precisión en la reproducción del timbre y cobertura lingüística. El modelo admite 40 idiomas...
GPT-5 - El modelo de lenguaje más sólido presentado por OpenAI, sistema de inteligencia unificado
GPT-5 es el último modelo de lenguaje lanzado por OpenAI con varias actualizaciones. Es un sistema de inteligencia unificada con un enrutador en tiempo real integrado que cambia automáticamente entre los modos de pensamiento eficiente y profundo en función de la complejidad del problema, lo que permite una respuesta rápida y respuestas precisas.GPT-5 tiene varias versiones, incluyendo para pu...