Bee - Proyecto de modelo multimodal de gran tamaño de código abierto Tencent Mixed Meta y Tsinghua
Bee es una solución de big model multimodal de código abierto de pila completa lanzada conjuntamente por el equipo de Tencent Mixed Element y la Universidad de Tsinghua para reducir la brecha de rendimiento entre los modelos de código abierto y los de código cerrado mediante la mejora de la calidad de los datos. El proyecto contiene tres logros fundamentales: el conjunto de datos CoT de dos capas de alta calidad a escala de 15 millones Honey-Data...
InfinityStar - Marco de generación de vídeo autorregresivo espaciotemporal unificado de código abierto Byte
InfinityStar es un marco autorregresivo espaciotemporal unificado de código abierto de ByteDance, diseñado para la generación de imágenes y vídeos de alta resolución. Utilizando un enfoque autorregresivo discreto, puede gestionar simultáneamente tareas de texto a imagen, texto a vídeo e imagen a vídeo en un único modelo. El marco se evalúa en VBench ...
Koina: plataforma descentralizada de aprendizaje automático de código abierto desarrollada por la Universidad Técnica de Múnich en colaboración con la Universidad de Michigan.
Koina es una plataforma de aprendizaje automático descentralizada y de código abierto cuyo objetivo es simplificar el análisis de datos proteómicos. Ha sido desarrollada por un equipo de la Universidad Técnica de Múnich (Alemania) y la Universidad de Michigan (EE.UU.). La plataforma integra más de 30 modelos principales (por ejemplo, ProSIT, MS²PIP) a través de una interfaz estandarizada y admite...
VibeThinker-1.5B - Weibo AI abre un modelo lingüístico a gran escala con 1.500 millones de parámetros
VibeThinker-1.5B es un modelo lingüístico a gran escala de 1.500 millones de parámetros de código abierto de Weibo AI. Basado en el modelo Qwen2.5-Math-1.5B de Alibaba, está optimizado para tareas matemáticas y de codificación y ofrece un rendimiento de inferencia líder en el sector.
BestBlogs - Plataforma de agregación de contenidos de AI de código abierto con una selección de contenidos técnicos de calidad.
BestBlogs es una plataforma centrada en ofrecer contenidos de alta calidad a profesionales de la tecnología, emprendedores, gestores de productos, etc. Recopila artículos, podcasts, vídeos y otros contenidos multiformato de más de 400 blogs de alta calidad a través de canales RSS y tecnología de rastreo. Su punto fuerte es el uso de la inteligencia...
Egocentric-10K - Conjunto de datos robóticos de código abierto sobre la perspectiva en primera persona de Build AI
Egocentric-10K es un conjunto de datos de vídeo a gran escala de operaciones de fábrica con vista en primera persona (egocéntrica) de código abierto del equipo build.ai. El conjunto de datos contiene 10.000 horas de vídeo, con un total de 1.080 millones de...
LazyCraft - Plataforma de desarrollo y gestión de aplicaciones de agentes de IA de código abierto, basada en LazyLLM
LazyCraft es una plataforma de desarrollo y gestión de aplicaciones de agentes de IA de código abierto creada por Shangtang basada en el marco de código abierto LazyLLM, que proporciona soluciones integrales de desarrollo de aplicaciones de IA para empresas y desarrolladores. Ayuda a los desarrolladores a construir y lanzar rápidamente grandes aplicaciones modelo con bajo umbral y bajo coste....
Kosong - Nuevo marco de desarrollo de agentes de IA de código abierto de Moonshot AI
Kosong es un nuevo marco de desarrollo de agentes de IA de código abierto de Moonshot AI, que proporciona a los desarrolladores un soporte subyacente ligero, flexible y altamente escalable para crear aplicaciones de cuerpos inteligentes de próxima generación. Con un motor de programación de herramientas asíncrono que programa eficientemente múltiples herramientas...
SenseNova-SI - Una familia de grandes modelos de inteligencia espacial de código abierto de ShangTang Technology
SenseNova-SI es un gran modelo de inteligencia espacial de código abierto lanzado por ShangTech, que se centra en mejorar la capacidad de la IA para la comprensión y el razonamiento espaciales. El modelo destaca en seis dimensiones básicas, como la medición espacial, la reconstrucción, el juicio de relaciones, la transformación de perspectivas, el análisis de deformaciones y el razonamiento espacial, superando...
Omnilingual ASR - Marco de reconocimiento del habla multilingüe de Meta
Omnilingual ASR es un marco de reconocimiento del habla multilingüe introducido por Meta, que cubre más de 1600 idiomas, con una tasa de error de caracteres lingüísticos 78% inferior a 10%. Su codificador wav2vec 2.0 de 7.000 millones de parámetros, combinado con el decodificador CTC y Transformer, admite...









