Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
Step-GUI - 阶跃星辰开源的AI Agent系列模型

meso- (química)Step-GUI - Modelos de la serie de agentes de IA de código abierto de Step-Star

Step-GUI es la serie de modelos de agentes de IA de código abierto de Step-Star, que incluye el modelo en la nube Step-GUI, el primer protocolo MCP para agentes GUI, y el primer modelo de código abierto del sector Step-GUI Edge para...
hace 10 horas
01.7K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

meso- (química)A2UI - Protocolo declarativo de código abierto de Google para interfaces de interacción de usuario basadas en agentes

A2UI (Agent-to-User Interface) es el protocolo de interfaz de código abierto de Google impulsado por agentes que aborda los retos de la generación de interfaces interactivas complejas para agentes de IA. A través de un formato JSON declarativo que permite a los agentes de IA describir la estructura de la interfaz de usuario , las aplicaciones cliente...
hace 10 horas
01.1K
SAM Audio - Meta推出的开源多模态音频分割模型

meso- (química)SAM Audio - Modelo de segmentación de audio multimodal de código abierto de Meta

SAM Audio es un modelo de segmentación de audio multimodal de código abierto de Meta que separa con precisión sonidos objetivo arbitrarios de mezclas de audio complejas. Mediante la combinación de pistas dimensionales textuales, visuales y temporales, permite un procesamiento de audio flexible y eficiente para tareas como la edición de audio,...
hace 12 horas
01.4K
混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

meso- (química)Mixed World Model 1.5 - Marco de generación de modelos del mundo en tiempo real de código abierto Tencent Mixed

Hybrid World Model 1.5 (Tencent HY WorldPlay) es el primer marco de modelo mundial en tiempo real de código abierto de la industria lanzado por Tencent, que cubre la cadena completa de despliegue de datos, formación e inferencia de streaming. El núcleo es el modelo de difusión autorregresiva WorldPlay, que utiliza...
Hace 1 día
02.8K
Molmo 2 - Ai2开源的多模态视频图像理解模型系列

meso- (química)Molmo 2 - Familia de modelos de comprensión multimodal de imágenes de vídeo de código abierto Ai2

Molmo 2 es un modelo multimodal de código abierto lanzado por el Allen Institute for AI (Ai2) para mejorar la comprensión de vídeos e imágenes múltiples. Incluye tres variantes: Molmo 2 (8B), Molmo 2 (4B) y Molmo 2-O...
Hace 1 día
02.5K
LongCat-Video-Avatar - 美团开源的虚拟人视频生成模型

meso- (química)LongCat-Video-Avatar - Modelo de generación de vídeo avatar de código abierto de Meituan

LongCat-Video-Avatar es un modelo avanzado de generación de vídeo basado en audio, creado a partir de LongCat-Video de código abierto por Meituan, que se centra en la generación de vídeos largos hiperrealistas y sincronizados con los labios, con una dinámica natural y una identidad coherente.
Hace 1 día
02.5K
MiMo-V2-Flash - 小米发布的开源MoE架构大模型

meso- (química)MiMo-V2-Flash - Un gran modelo de la arquitectura MoE de código abierto lanzado por Xiaomi

MiMo-V2-Flash es un gran modelo de arquitectura MoE de código abierto lanzado por Xiaomi, con 309.000 millones de parámetros totales y 15.000 millones de parámetros activos, centrado en el razonamiento eficiente y las aplicaciones corporales inteligentes. El modelo adopta una arquitectura de atención híbrida y tecnología de meta-predicción multi-palabra, con una velocidad de inferencia de 150 tokens/segundo, en...
Hace 1 día
03.3K
Nemotron 3 - 英伟达发布的开源 AI 模型系列

Nemotron 3 - Una familia de modelos de IA de código abierto publicada por NVIDIA

Nemotron 3 es una familia de modelos de IA de código abierto lanzada por NVIDIA en tamaños Nano, Super y Ultra. Nemotron 3 adopta una arquitectura MoE latente que mejora significativamente la eficiencia de la inferencia y reduce los costes operativos. Entre ellos...
hace 2 días
05K
Wan-Move - 阿里通义联合清华等开源的AI视频生成框架

Wan-Move: el marco de código abierto de Ali Tongyi para la generación de vídeo con inteligencia artificial, en colaboración con Tsinghua y otros organismos.

Wan-Move es un marco de generación de vídeo de IA de código abierto desarrollado conjuntamente por Ali Tongyi Labs, la Universidad de Tsinghua y otras instituciones, centrado en la composición de vídeo de alta calidad mediante una tecnología precisa de control del movimiento. La tecnología central es la "guía de trayectoria potencial", que puede añadir sin problemas el control de movimiento a nivel de punto al modelo existente de imagen a vídeo...
hace 2 días
04.9K
PaCoRe - 阶跃星辰开源的并行协同AI推理框架

PaCoRe - Marco de razonamiento colaborativo paralelo de StepStar para la Inteligencia Artificial

PaCoRe (Parallel Coordinated Reasoning) es el innovador marco de razonamiento colaborativo paralelo de código abierto de StepFun, a través de un mecanismo de pensamiento masivamente paralelo, desde múltiples perspectivas para explorar simultáneamente la solución del problema, rompiendo...
hace 2 días
04.2K