Hunyuan-MT-7B - Modelo de traducción ligera de código abierto Tencent Mixed Meta
Hunyuan-MT-7B es un modelo de traducción ligero introducido por el Mixed Meta Team de Tencent, con 7.000 millones de referencias, que admite la traducción mutua de 33 idiomas y 5 lenguas/dialectos del chino popular, incluidos el cantonés, el uigur y el tibetano. En el concurso WMT2025 de la Asociación Internacional de Lingüística Computacional (ACL)...
Step-Audio 2 mini - Macromodelado del habla de código abierto Step-Star
Step-Audio 2 mini es un macromodelo del habla integral de código abierto de Step-Audio. Rompe con la estructura tradicional del modelo del habla y adopta una verdadera arquitectura multimodal de extremo a extremo, que transforma directamente la entrada de audio sin procesar en salida de respuesta del habla, con menor latencia, y comprende la información paralingüística y las señales no vocales.
MobileCLIP2: el eficiente modelo multimodal de código abierto de Apple
MobileCLIP2 es una versión mejorada de MobileCLIP, un eficiente modelo multimodal de extremo introducido por investigadores de Apple. Optimizado para el entrenamiento de refuerzo multimodal, integra el modelo de profesor CLIP mediante el entrenamiento de un mejor rendimiento en el conjunto de datos DFN y la mejora de la generat...
InternVL3.5 - Modelos grandes multimodales de código abierto de Shanghai AI Lab
InternVL3.5 (Shusheng-Wanxiang 3.5) es un gran modelo multimodal de código abierto del Laboratorio de Inteligencia Artificial de Shanghai, el modelo está totalmente actualizado en términos de capacidad general, capacidad de razonamiento y eficiencia de despliegue, proporcionando nueve tamaños de versiones de 1.000 millones a 241.000 millones de parámetros, cubriendo diferentes escenarios de demanda de recursos,...
FastVLM - Modelado de lenguaje visual de Apple
FastVLM (Fast Vision Language Model) es un eficiente modelo de lenguaje visual introducido por Apple. Con el codificador visual híbrido FastViTHD como núcleo, incorpora arquitecturas convolucionales y Transformer para reducir significativamente los...
MiniCPM-V 4.5 - Modelo multimodal facetado inteligente de código abierto de 8B parámetros
MiniCPM-V 4.5 es un modelo paramétrico multimodal 8B de código abierto para Inteligencia de Fachadas, construido en base a Qwen3-8B y SigLIP2-400M, con capacidad para procesar eficientemente imágenes y vídeos. Tiene un excelente rendimiento en el consumo de tokens visuales, procesamiento ...
Aivilization, una plataforma de simulación social multiagente lanzada por la HKUST
Aivilization es la primera plataforma de simulación social de cuerpos multiinteligentes de IA del mundo, desarrollada por la Universidad de Ciencia y Tecnología de Hong Kong. Construye una caja de arena digital visual donde los usuarios pueden crear y guiar a miles de inteligencias IA para observar la evolución social de la futura coexistencia entre humanos e IA. La plataforma admite...
Grok 2.5 - El modelo de IA de código abierto xAI de Musk
Grok 2.5 es un modelo de IA de código abierto de la xAI de Elon Musk. Con 269.000 millones de parámetros, se basa en la arquitectura Mixed Expertise (MoE) para un rendimiento y una inferencia potentes. El modelo se ha probado con conocimientos científicos de nivel universitario (GPQA), conocimientos de uso general (MMLU, MM...
Draw A Fish - sitio de dibujo de peces en línea gratis con peceras virtuales compartidas
Draw A Fish es un sencillo y divertido sitio de dibujo de peces en línea en el que los usuarios pueden dibujar peces para colocarlos en una pecera virtual compartida globalmente.
ToonComposer - Herramienta de animación de IA generativa de código abierto de Tencent
ToonComposer es una herramienta de animación generativa por IA lanzada conjuntamente por la Universidad China de Hong Kong, Tencent PCG ARC Lab y la Universidad de Pekín. Gracias a la tecnología generativa de fotogramas clave posteriores, el proceso de generación de fotogramas intermedios y de coloreado se integra en un proceso automatizado que solo requiere un boceto y...