Xiaomi-MiMo-Audio: el primer modelo nativo de voz de extremo a extremo de código abierto de Xiaomi
Xiaomi-MiMo-Audio es el macromodelo de voz de Xiaomi de código abierto con 7.000 millones de parámetros de extremo a extremo y potentes funciones como el diálogo multilingüe, la continuación del habla, la generalización de menos muestras y la comprensión de audio, capaz de alcanzar el nivel SOTA en inteligencia del habla y comprensión de audio, superando a Google Gemi...
WebWeaver - Ali Tongyi abre un nuevo marco corporal de doble inteligencia
WebWeaver es un nuevo marco corporal de doble inteligencia introducido por el equipo de Alibaba Tongyi, que se utiliza principalmente en la investigación profunda abierta, y puede simular el proceso de investigación humana, que se divide en dos inteligencias: planificación y escritura.
MCP Registry - La plataforma oficial de gestión de servidores MCP de GitHub.
MCP Registry es una plataforma centralizada de GitHub que ayuda a los desarrolladores a descubrir e instalar servidores MCP más fácilmente.Con MCP Registry, los desarrolladores pueden encontrar rápidamente las herramientas de AI que necesitan en un solo lugar, simplificando enormemente...
Tongyi DeepResearch - Cuerpo de inteligencia de investigación profunda de código abierto Ali Tongyi
Tongyi DeepResearch (Tongyi Investigación Profunda) es un organismo inteligente de código abierto lanzado por Alibaba, diseñado para la recuperación profunda de información y el razonamiento de tareas complejas, con 30.000 millones de parámetros, compatible con múltiples modos de razonamiento, incluidos el modo ReAct y el modo de profundidad...
Guía en PDF de OpenAI para mantenerse a la vanguardia en la era de la IA - con enlaces de descarga
Staying ahead in the age of AI es una guía de liderazgo en IA de OpenAI que ayuda a los líderes empresariales a mantener una ventaja competitiva en la era de la IA. La guía señala el rápido crecimiento de la IA, con lanzamientos de modelos más rápidos, costes más bajos y una adopción empresarial más rápida....
PDF gratuito de Fundamentos de grandes modelos de la Universidad de Zhejiang - con enlace de descarga
Fundamentos de los grandes modelos ofrece un análisis en profundidad de las tecnologías básicas y las vías prácticas de los grandes modelos lingüísticos (LLM). Partiendo de la teoría fundamental de la modelización lingüística, explica sistemáticamente los principios del diseño de modelos basados en arquitecturas estadísticas, de redes neuronales recurrentes (RNN) y Transformer, centrándose en los tres grandes modelos lingüísticos....
LLaSO: el primer modelo de voz de código abierto de Logic Intelligence
LLaSO es un modelo del habla de código abierto lanzado por Beijing Depth Logic Intelligence Technology Co. Ltd, que resuelve los problemas de dispersión de datos e insuficiente cobertura de tareas en el campo del modelado del lenguaje del habla a gran escala integrando datos del habla y del texto y proporcionando conjuntos de datos de alineación, conjuntos de datos de ajuste de comandos y puntos de referencia de evaluación.
Hybrid 3D 3.0: modelos generados en 3D de Tencent compatibles con UHD
Hybrid 3D 3.0 es un modelo avanzado de generación 3D de Tencent, basado en la tecnología de esculpido jerárquico 3D-DiT, con una resolución geométrica de hasta 1536³, capaz de generar modelos 3D de ultra alta definición y ricos en detalles, y de destacar en el modelado de personajes, con capacidad para modelar con precisión los cinco sentidos y la forma del cuerpo.
Mini-o3 - Bytes, modelo conjunto de razonamiento visual de código abierto de la HKU
Mini-o3 es un modelo de código abierto lanzado conjuntamente por ByteDance y la Universidad de Hong Kong, centrado en la resolución de problemas complejos de búsqueda visual. El modelo tiene una potente capacidad de razonamiento interactivo multirronda y puede localizar un objetivo mediante exploración profunda y ensayo-error.
GPT-5-Codex: el modelo de programación más sólido introducido por OpenAI
GPT-5-Codex es un potente modelo de optimización de programación de OpenAI, mejorado por GPT-5 y diseñado para ingenieros de software. El modelo genera código de alta calidad con rapidez, es compatible con múltiples lenguajes de programación y optimiza el código existente para mejorar el rendimiento.