Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
Ouro - 字节跳动Seed团队开源的新型循环语言模型

meso- (química)Ouro - Un nuevo modelo de lenguaje cíclico de código abierto del equipo ByteHopper Seed

Ouro es un nuevo tipo de Looped Language Models (LLMs) desarrollado por el equipo de ByteDance Seed, con la innovación central de construir directamente capacidades de inferencia en la fase de pre-entrenamiento a través de una estructura computacional recurrente de parámetros compartidos. El modelo utiliza 24 capas como bloque base, a través de...
hace 8 horas
0937
ChronoEdit - 英伟达与多伦多大学联合开源的AI图像编辑框架

meso- (química)ChronoEdit: NVIDIA y la Universidad de Toronto abren un marco de edición de imágenes basado en IA

ChronoEdit, un marco de edición de imágenes de IA de código abierto desarrollado conjuntamente por NVIDIA y la Universidad de Toronto, redefine la tarea de edición de imágenes como una tarea de generación de vídeo para garantizar que los resultados de la edición sean coherentes temporal y físicamente. Mediante la destilación de un modelo de generación de vídeo preentrenado con 14B...
hace 9 horas
0837
LongCat-Flash-Omni - 美团开源的全模态大语言模型

meso- (química)LongCat-Flash-Omni - Un modelo de gran lenguaje completamente modal para Meituan Open Source

LongCat-Flash-Omni es un modelo de gran lenguaje de código abierto totalmente modal lanzado por el equipo LongCat de Meituan. Con una escala de parámetros de 560.000 millones (27.000 millones de parámetros activados), consigue capacidades de interacción de audio y vídeo en tiempo real de nivel de milisegundos manteniendo un gran número de parámetros.
Hace 1 día
02.6K
Petri - Anthropic开源的 AI 安全审计框架

meso- (química)Petri - Marco de auditoría de seguridad de IA de código abierto de Anthropic

Petri es un marco de auditoría de seguridad de IA de código abierto desarrollado por Anthropic que evalúa sistemáticamente la seguridad y la alineación del comportamiento de los modelos de IA. Mediante la simulación de un escenario real en el que un auditor automatizado participa en múltiples rondas de diálogo con un modelo objetivo, seguido de un agente juez que actúa sobre el modelo de...
Hace 1 día
02.3K
Kimi Linear - 月之暗面开源的新型混合线性注意力架构

Kimi Linear: una novedosa arquitectura híbrida de atención lineal de código abierto en el Lado Oscuro de la Luna

Kimi Linear es una nueva arquitectura híbrida de atención lineal de código abierto de Dark Side of the Moon, con Kimi Delta Attention (KDA) como núcleo, que optimiza el modelo de atención tradicional mediante un mecanismo de control más preciso, mejorando significativamente la eficiencia del hardware y la capacidad de control de la memoria...
hace 4 días
09.3K
FIBO - 全球首个开源原生支持JSON的文本生成图像模型

FIBO - El primer texto JSON de código abierto del mundo con soporte nativo para generar modelos de imagen

FIBO es el primer modelo de imagen de generación de texto de código abierto del mundo con soporte nativo JSON desarrollado por Bria AI. Basado en la arquitectura DiT (Diffusion Transformer) con 8B parámetros, adopta el método de entrenamiento Flow Matching....
hace 5 días
06K
SoulX-Podcast - Soul AI Lab开源的对话式语音合成模型

SoulX-Podcast - Modelo de síntesis de voz conversacional de código abierto de Soul AI Lab

SoulX-Podcast es el modelo avanzado de síntesis de voz conversacional multihablante de código abierto de Soul AI Lab diseñado para generar contenidos de podcast de alta calidad. SoulX-Podcast tiene la capacidad de generar múltiples rondas de diálogo y puede simular un diálogo fluido en escenarios reales de podcasting, soportando mandarín, inglés y múltiples...
hace 6 días
010.7K
GigaBrain-0 - 开源的具身基础模型,由世界模型生成数据驱动

GigaBrain-0 - Modelo básico encarnado de código abierto basado en datos de generación de modelos mundiales

GigaBrain-0 es el primer modelo de base encarnada Visión-Lenguaje-Acción (VLA) integral de China que utiliza datos de generación de modelos mundiales para lograr una generalización real de la máquina, y está publicado conjuntamente como código abierto por GigaVision y el Centro de Innovación en Robótica Humanoide de Hubei. Adopta la arquitectura híbrida Transformer, que fusiona ...
hace 6 días
06.3K
Ming-flash-omni-Preview - 蚂蚁集团开源的全模态大模型

Ming-flash-omni-Preview - Macromodelo totalmente modal de código abierto del Grupo Ant

Ming-flash-omni-Preview es un macromodelo full-modal de código abierto lanzado por Ant Group inclusionAI, con una escala de parámetros de cientos de miles de millones, basado en la arquitectura sparse MoE de Ling 2.0, con parámetros totales de 103B y activaciones de 9B. en la comprensión full-modal y la generación...
hace 6 días
07.7K
OmniVinci - NVIDIA开源的全模态大语言模型

OmniVinci: el modelo de gran lenguaje omnimodal de código abierto de NVIDIA

OmniVinci es un modelo lingüístico a gran escala, totalmente modal y de código abierto desarrollado por NVIDIA que resuelve el problema de la fragmentación modal en modelos multimodales mediante la innovación arquitectónica y la optimización de datos. La alineación de las incrustaciones visuales y sonoras se mejora mediante OmniAlignNet, que utiliza la captura de grupos incrustada temporalmente....
Hace 7 días
08.9K