meso- (química)Ouro - Un nuevo modelo de lenguaje cíclico de código abierto del equipo ByteHopper Seed
Ouro es un nuevo tipo de Looped Language Models (LLMs) desarrollado por el equipo de ByteDance Seed, con la innovación central de construir directamente capacidades de inferencia en la fase de pre-entrenamiento a través de una estructura computacional recurrente de parámetros compartidos. El modelo utiliza 24 capas como bloque base, a través de...
meso- (química)ChronoEdit: NVIDIA y la Universidad de Toronto abren un marco de edición de imágenes basado en IA
ChronoEdit, un marco de edición de imágenes de IA de código abierto desarrollado conjuntamente por NVIDIA y la Universidad de Toronto, redefine la tarea de edición de imágenes como una tarea de generación de vídeo para garantizar que los resultados de la edición sean coherentes temporal y físicamente. Mediante la destilación de un modelo de generación de vídeo preentrenado con 14B...
meso- (química)LongCat-Flash-Omni - Un modelo de gran lenguaje completamente modal para Meituan Open Source
LongCat-Flash-Omni es un modelo de gran lenguaje de código abierto totalmente modal lanzado por el equipo LongCat de Meituan. Con una escala de parámetros de 560.000 millones (27.000 millones de parámetros activados), consigue capacidades de interacción de audio y vídeo en tiempo real de nivel de milisegundos manteniendo un gran número de parámetros.
meso- (química)Petri - Marco de auditoría de seguridad de IA de código abierto de Anthropic
Petri es un marco de auditoría de seguridad de IA de código abierto desarrollado por Anthropic que evalúa sistemáticamente la seguridad y la alineación del comportamiento de los modelos de IA. Mediante la simulación de un escenario real en el que un auditor automatizado participa en múltiples rondas de diálogo con un modelo objetivo, seguido de un agente juez que actúa sobre el modelo de...
Kimi Linear: una novedosa arquitectura híbrida de atención lineal de código abierto en el Lado Oscuro de la Luna
Kimi Linear es una nueva arquitectura híbrida de atención lineal de código abierto de Dark Side of the Moon, con Kimi Delta Attention (KDA) como núcleo, que optimiza el modelo de atención tradicional mediante un mecanismo de control más preciso, mejorando significativamente la eficiencia del hardware y la capacidad de control de la memoria...
FIBO - El primer texto JSON de código abierto del mundo con soporte nativo para generar modelos de imagen
FIBO es el primer modelo de imagen de generación de texto de código abierto del mundo con soporte nativo JSON desarrollado por Bria AI. Basado en la arquitectura DiT (Diffusion Transformer) con 8B parámetros, adopta el método de entrenamiento Flow Matching....
SoulX-Podcast - Modelo de síntesis de voz conversacional de código abierto de Soul AI Lab
SoulX-Podcast es el modelo avanzado de síntesis de voz conversacional multihablante de código abierto de Soul AI Lab diseñado para generar contenidos de podcast de alta calidad. SoulX-Podcast tiene la capacidad de generar múltiples rondas de diálogo y puede simular un diálogo fluido en escenarios reales de podcasting, soportando mandarín, inglés y múltiples...
GigaBrain-0 - Modelo básico encarnado de código abierto basado en datos de generación de modelos mundiales
GigaBrain-0 es el primer modelo de base encarnada Visión-Lenguaje-Acción (VLA) integral de China que utiliza datos de generación de modelos mundiales para lograr una generalización real de la máquina, y está publicado conjuntamente como código abierto por GigaVision y el Centro de Innovación en Robótica Humanoide de Hubei. Adopta la arquitectura híbrida Transformer, que fusiona ...
Ming-flash-omni-Preview - Macromodelo totalmente modal de código abierto del Grupo Ant
Ming-flash-omni-Preview es un macromodelo full-modal de código abierto lanzado por Ant Group inclusionAI, con una escala de parámetros de cientos de miles de millones, basado en la arquitectura sparse MoE de Ling 2.0, con parámetros totales de 103B y activaciones de 9B. en la comprensión full-modal y la generación...
OmniVinci: el modelo de gran lenguaje omnimodal de código abierto de NVIDIA
OmniVinci es un modelo lingüístico a gran escala, totalmente modal y de código abierto desarrollado por NVIDIA que resuelve el problema de la fragmentación modal en modelos multimodales mediante la innovación arquitectónica y la optimización de datos. La alineación de las incrustaciones visuales y sonoras se mejora mediante OmniAlignNet, que utiliza la captura de grupos incrustada temporalmente....









