BAGEL - Modelo de base multimodal de código abierto lanzado por Wordpress
BAGEL es un modelo base multimodal de código abierto de ByteDance con 14.000 millones de parámetros, de los cuales 7.000 millones están activos. La base del modelo y la Arquitectura Experta de Transformación Mixta (MoT), que captura las características a nivel de píxel y a nivel semántico de una imagen con dos codificadores independientes respectivamente, admite un procesamiento eficiente de imagen, texto, vídeo...
DeepSeek-R1 - Modelo de inferencia de IA de DeepSeek, rendimiento alineado con la versión OpenAI o1
DeepSeek-R1 es un modelo de inferencia de IA de alto rendimiento lanzado por DeepSeek, con sede en Hangzhou, que se compara con la versión oficial o1 de OpenAI. El modelo está post-entrenado sobre la base de técnicas de aprendizaje por refuerzo a gran escala y solo requiere una cantidad muy pequeña de datos etiquetados para razonar en matemáticas, código y lenguaje natural....
Phantom Boat AI - Plataforma única de creación de cortometrajes con IA, generación por lotes de varios tipos de contenidos de vídeo.
Phantom Boat AI es una potente plataforma integral de creación de cortometrajes con IA que permite la generación eficiente por lotes de varios tipos de contenidos de vídeo, incluidos anuncios, promos, animaciones y mucho más. La plataforma se basa en Midjourney, Runway y otros modelos de IA líderes en el mundo, y ofrece a los creadores una amplia gama de servicios, desde la escritura de guiones hasta...
Circuit Tracer - Herramienta de código abierto de Anthropic para visualizar el funcionamiento interno de un modelo.
Circuit Tracer es una herramienta de código abierto de Anthropic para estudiar el funcionamiento interno de grandes modelos lingüísticos. Se basa en la generación de gráficos de atribución (attribution graphs) para revelar los pasos internos que sufre el modelo al generar una determinada salida...
Google AI Edge Gallery - Google lanza una aplicación de IA para ayudar a los teléfonos móviles a ejecutar modelos de IA
Google AI Edge Gallery es una aplicación de IA experimental de Google que permite a los usuarios experimentar y utilizar modelos de aprendizaje automático (ML) e inteligencia artificial generativa (GenAI) en dispositivos nativos. La aplicación es compatible con dispositivos Android.
Data Agent - Una nueva generación de inteligencia de datos de clase empresarial de Volcano Engine
Data Agent es una nueva generación de inteligencia de datos de nivel empresarial lanzada por Volcano Engine, centrada en la analítica de datos y el marketing inteligente.Data Agent integra datos estructurados y no estructurados dentro de la empresa, y genera informes de investigación exhaustivos y en profundidad basados en investigaciones y análisis en profundidad.
Keling 2.1 - Modelos de generación de vídeo AI de Shutterstock
KeLing 2.1 es un modelo de generación de vídeo AI lanzado por Racer, que ya está disponible en la plataforma de vídeo AI KeLing. El modelo contiene tres versiones: estándar, de alta calidad y maestra, que proporcionan 720P, 1080P y efectos de nivel cinematográfico para satisfacer diferentes necesidades creativas. La versión estándar de la velocidad de generación, adecuada para la producción rápida...
Little Lark - Agente de creación inteligente de Shear Image
Little Lark es un agente de creación inteligente lanzado por Shear Image, basado en la tecnología de IA para remodelar los límites de la creación de contenidos, haciendo la creación más simple, más eficiente y más interesante. Little Lark admite la creación sin umbral de vídeos, vídeos emergentes digitales, dibujos de diseño e imágenes para fondos, los usuarios solo necesitan introducir un comando, el soporte de IA completa eficientemente....
Drafting AI Community - Plataforma de diseño de contenidos creativos con IA, una variedad de recursos de diseño para satisfacer diferentes necesidades creativas.
Drafting AI Community es una plataforma en línea de inspiración creativa en IA que proporciona a los usuarios una gran cantidad de recursos y herramientas de diseño creativo. La plataforma abarca diversos campos del diseño, como fotos de imágenes, diseño de comercio electrónico, temas de vacaciones, ilustraciones en 3D, diseño de avatares, materiales Xiaohongshu, diseño de retratos, etc., para satisfacer las necesidades de los distintos usuarios.
Ming-lite-omni - Macromodelos multimodales unificados de código abierto del equipo Ant 100
Ming-Lite-Omni es un big model multimodal unificado de código abierto del equipo Bailing Big Model de Ant Group, basado en la eficaz arquitectura Mixture of Experts (MoE). Ming-Lite-Omni permite procesar texto, imágenes, audio y vídeo....