Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
FG-CLIP 2 - 360开源的图文跨模态视觉语言模型

FG-CLIP 2 - 360 Modelo de lenguaje visual multimodal de código abierto para gráficos

FG-CLIP 2 es el modelo gráfico de lenguaje visual multimodal (VL-M) líder en el mundo, lanzado por el Instituto de Investigación 360 Artificial Intelligence, que ha superado a modelos similares de Google y Meta en 29 pruebas comparativas autorizadas, lo que lo convierte en el VL-M más potente de la actualidad....
hace 5 meses
027.8K
微舆BettaFish - 开源的多智能体舆情分析系统

Micro Opinion BettaFish - Sistema de análisis de opiniones multiinteligencia de código abierto

BettaFish es un sistema de análisis de opinión multi-inteligencia de código abierto. Utilizando la arquitectura de cuerpo multi-inteligente, a través de Query, Media, Insight, Report y otros Agentes trabajan juntos para lograr la recuperación, extracción y presentación de informes de bucle cerrado. El sistema es compatible con ...
hace 5 meses
060.9K
Ouro - 字节跳动Seed团队开源的新型循环语言模型

Ouro - Un nuevo modelo de lenguaje cíclico de código abierto del equipo ByteHopper Seed

Ouro es un nuevo tipo de Looped Language Models (LLMs) desarrollado por el equipo de ByteDance Seed, con la innovación central de construir directamente capacidades de inferencia en la fase de pre-entrenamiento a través de una estructura computacional recurrente de parámetros compartidos. El modelo utiliza 24 capas como bloque base, a través de...
hace 5 meses
036.5K
ChronoEdit - 英伟达与多伦多大学联合开源的AI图像编辑框架

ChronoEdit: NVIDIA y la Universidad de Toronto abren un marco de edición de imágenes basado en IA

ChronoEdit, un marco de edición de imágenes de IA de código abierto desarrollado conjuntamente por NVIDIA y la Universidad de Toronto, redefine la tarea de edición de imágenes como una tarea de generación de vídeo para garantizar que los resultados de la edición sean coherentes temporal y físicamente. Mediante la destilación de un modelo de generación de vídeo preentrenado con 14B...
hace 5 meses
031.9K
LongCat-Flash-Omni - 美团开源的全模态大语言模型

LongCat-Flash-Omni - Un modelo de gran lenguaje completamente modal para Meituan Open Source

LongCat-Flash-Omni es un modelo de gran lenguaje de código abierto totalmente modal lanzado por el equipo LongCat de Meituan. Con una escala de parámetros de 560.000 millones (27.000 millones de parámetros activados), consigue capacidades de interacción de audio y vídeo en tiempo real de nivel de milisegundos manteniendo un gran número de parámetros.
hace 5 meses
030K
Petri - Anthropic开源的 AI 安全审计框架

Petri - Marco de auditoría de seguridad de IA de código abierto de Anthropic

Petri es un marco de auditoría de seguridad de IA de código abierto desarrollado por Anthropic que evalúa sistemáticamente la seguridad y la alineación del comportamiento de los modelos de IA. Mediante la simulación de un escenario real en el que un auditor automatizado participa en múltiples rondas de diálogo con un modelo objetivo, seguido de un agente juez que actúa sobre el modelo de...
hace 5 meses
026.4K
Kimi Linear - 月之暗面开源的新型混合线性注意力架构

Kimi Linear: una novedosa arquitectura híbrida de atención lineal de código abierto en el Lado Oscuro de la Luna

Kimi Linear es una nueva arquitectura híbrida de atención lineal de código abierto de Dark Side of the Moon, con Kimi Delta Attention (KDA) como núcleo, que optimiza el modelo de atención tradicional mediante un mecanismo de control más preciso, mejorando significativamente la eficiencia del hardware y la capacidad de control de la memoria...
hace 5 meses
038.5K
FIBO - 全球首个开源原生支持JSON的文本生成图像模型

FIBO - El primer texto JSON de código abierto del mundo con soporte nativo para generar modelos de imagen

FIBO es el primer modelo de imagen de generación de texto de código abierto del mundo con soporte nativo JSON desarrollado por Bria AI. Basado en la arquitectura DiT (Diffusion Transformer) con 8B parámetros, adopta el método de entrenamiento Flow Matching....
hace 5 meses
030.8K
SoulX-Podcast - Soul AI Lab开源的对话式语音合成模型

SoulX-Podcast - Modelo de síntesis de voz conversacional de código abierto de Soul AI Lab

SoulX-Podcast es el modelo avanzado de síntesis de voz conversacional multihablante de código abierto de Soul AI Lab diseñado para generar contenidos de podcast de alta calidad. SoulX-Podcast tiene la capacidad de generar múltiples rondas de diálogo y puede simular un diálogo fluido en escenarios reales de podcasting, soportando mandarín, inglés y múltiples...
hace 5 meses
039.6K
GigaBrain-0 - 开源的具身基础模型,由世界模型生成数据驱动

GigaBrain-0 - Modelo básico encarnado de código abierto basado en datos de generación de modelos mundiales

GigaBrain-0 es el primer modelo de base encarnada Visión-Lenguaje-Acción (VLA) integral de China que utiliza datos de generación de modelos mundiales para lograr una generalización real de la máquina, y está publicado conjuntamente como código abierto por GigaVision y el Centro de Innovación en Robótica Humanoide de Hubei. Adopta la arquitectura híbrida Transformer, que fusiona ...
hace 5 meses
027.1K