Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
HunyuanWorld-Voyager - 腾讯开源的超长漫游世界模型

HunyuanWorld-Voyager - Modelo mundial de itinerancia ultralarga de código abierto de Tencent

HunyuanWorld-Voyager (abreviado Hunyuan Voyager) es el primer modelo de mundo itinerante ultralargo de la industria lanzado por Tencent que admite la reconstrucción nativa en 3D. Se trata de un novedoso marco de difusión de vídeo que genera secuencias de nubes de puntos 3D de trayectorias de cámara definidas por el usuario a partir de una sola imagen,...
hace 7 meses
040.3K
Hunyuan-MT-7B - 腾讯混元开源的轻量级翻译模型

Hunyuan-MT-7B - Modelo de traducción ligera de código abierto Tencent Mixed Meta

Hunyuan-MT-7B es un modelo de traducción ligero introducido por el Mixed Meta Team de Tencent, con 7.000 millones de referencias, que admite la traducción mutua de 33 idiomas y 5 lenguas/dialectos del chino popular, incluidos el cantonés, el uigur y el tibetano. En el concurso WMT2025 de la Asociación Internacional de Lingüística Computacional (ACL)...
hace 7 meses
037.4K
Step-Audio 2 mini - 阶跃星辰开源的语音大模型

Step-Audio 2 mini - Macromodelado del habla de código abierto Step-Star

Step-Audio 2 mini es un macromodelo del habla integral de código abierto de Step-Audio. Rompe con la estructura tradicional del modelo del habla y adopta una verdadera arquitectura multimodal de extremo a extremo, que transforma directamente la entrada de audio sin procesar en salida de respuesta del habla, con menor latencia, y comprende la información paralingüística y las señales no vocales.
hace 7 meses
046.5K
MobileCLIP2 - 苹果公司开源的高效端侧多模态模型

MobileCLIP2: el eficiente modelo multimodal de código abierto de Apple

MobileCLIP2 es una versión mejorada de MobileCLIP, un eficiente modelo multimodal de extremo introducido por investigadores de Apple. Optimizado para el entrenamiento de refuerzo multimodal, integra el modelo de profesor CLIP mediante el entrenamiento de un mejor rendimiento en el conjunto de datos DFN y la mejora de la generat...
hace 7 meses
050.2K
InternVL3.5 - 上海AI实验室开源的多模态大模型

InternVL3.5 - Modelos grandes multimodales de código abierto de Shanghai AI Lab

InternVL3.5 (Shusheng-Wanxiang 3.5) es un gran modelo multimodal de código abierto del Laboratorio de Inteligencia Artificial de Shanghai, el modelo está totalmente actualizado en términos de capacidad general, capacidad de razonamiento y eficiencia de despliegue, proporcionando nueve tamaños de versiones de 1.000 millones a 241.000 millones de parámetros, cubriendo diferentes escenarios de demanda de recursos,...
hace 7 meses
048.7K
FastVLM - 苹果公司推出的视觉语言模型

FastVLM - Modelado de lenguaje visual de Apple

FastVLM (Fast Vision Language Model) es un eficiente modelo de lenguaje visual introducido por Apple. Con el codificador visual híbrido FastViTHD como núcleo, incorpora arquitecturas convolucionales y Transformer para reducir significativamente los...
hace 7 meses
046.4K
MiniCPM-V 4.5 - 面壁智能开源的8B参数多模态模型

MiniCPM-V 4.5 - Modelo multimodal facetado inteligente de código abierto de 8B parámetros

MiniCPM-V 4.5 es un modelo paramétrico multimodal 8B de código abierto para Inteligencia de Fachadas, construido en base a Qwen3-8B y SigLIP2-400M, con capacidad para procesar eficientemente imágenes y vídeos. Tiene un excelente rendimiento en el consumo de tokens visuales, procesamiento ...
hace 7 meses
052.4K
Aivilization - 港科大推出的多Agent社会模拟平台

Aivilization, una plataforma de simulación social multiagente lanzada por la HKUST

Aivilization es la primera plataforma de simulación social de cuerpos multiinteligentes de IA del mundo, desarrollada por la Universidad de Ciencia y Tecnología de Hong Kong. Construye una caja de arena digital visual donde los usuarios pueden crear y guiar a miles de inteligencias IA para observar la evolución social de la futura coexistencia entre humanos e IA. La plataforma admite...
hace 7 meses
081.6K
Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

Grok 2.5 - El modelo de IA de código abierto xAI de Musk

Grok 2.5 es un modelo de IA de código abierto de la xAI de Elon Musk. Con 269.000 millones de parámetros, se basa en la arquitectura Mixed Expertise (MoE) para un rendimiento y una inferencia potentes. El modelo se ha probado con conocimientos científicos de nivel universitario (GPQA), conocimientos de uso general (MMLU, MM...
hace 7 meses
047.2K
Draw A Fish - 免费的在线AI画鱼网站,共享虚拟鱼缸

Draw A Fish - sitio de dibujo de peces en línea gratis con peceras virtuales compartidas

Draw A Fish es un sencillo y divertido sitio de dibujo de peces en línea en el que los usuarios pueden dibujar peces para colocarlos en una pecera virtual compartida globalmente.
hace 8 meses
066.7K