HunyuanImage 3.0 - Modelo gratuito de generación de imágenes multimodales de código abierto de Tencent
HunyuanImage 3.0 (Hunyuan Image 3.0) es un modelo nativo de generación de imágenes multimodales publicado y de código abierto por Tencent. El tamaño de los parámetros del modelo de 80B, es actualmente los mejores resultados de evaluación, el mayor número de parámetros del modelo de generación de imágenes de código abierto. Hybrid Image 3.0 soporta la generación de imágenes en tiempo real, los usuarios pueden...
Hunyuan3D-Part - Modelo gratuito de generación de componentes 3D de código abierto de Tencent
Hunyuan3D-Part (Hybrid 3D-Part) es un modelo de generación 3D lanzado y de código abierto por Tencent. Compuesto por P3 - SAM y X - Part, es la primera vez que se consigue una generación 3D basada en componentes de alta precisión y controlable, soportando 50 + componentes generados automáticamente. Los usuarios pueden...
AudioFly - Modelo de IA de sonido para generación de texto de código abierto KU Xunfei
AudioFly es un modelo de IA de código abierto para generar efectos de sonido a partir de texto de KDDI. Basado en la arquitectura del modelo de difusión potencial, con mil millones de parámetros, entrenado en conjuntos de datos de texto de audio diversos y a gran escala, que abarcan conjuntos de datos públicos como AudioSet, AudioCaps, TUT e internos....
Hunyuan3D-Omni - Marco de generación de modelos 3D de código abierto mixto de Tencent
Hunyuan3D-Omni (Hybrid 3D-Omni) es un marco de generación de activos 3D de código abierto del equipo Hybrid 3D de Tencent, que permite generar modelos 3D precisos mediante múltiples señales de control. Basado en la arquitectura Hunyuan3D 2.1, introduce un codificador de control unificado que puede...
FLM-Audio - Modelo de diálogo de audio dúplex completo (FLM-Audio) de código abierto creado por WisdomSource en colaboración con el Instituto Tecnológico de Nanyang (NTI).
FLM-Audio es un macromodelo de diálogo de audio full-duplex nativo publicado por el Instituto de Investigación de Inteligencia Artificial Zhiyuan de Pekín en colaboración con Spin Matrix y la Universidad Tecnológica Nanyang de Singapur, que admite tanto el chino como el inglés. Al adoptar una arquitectura full-duplex nativa, puede combinar la escucha, el habla y el monólogo en cada paso temporal...
CWM - Modelo Meta FAIR de lenguaje mundial de código abierto
CWM (Code World Model) es un modelo de lenguaje mundial de código abierto con 32.000 millones de parámetros publicado por el equipo Meta FAIR, diseñado para la generación y el razonamiento de código. Introduce el concepto de "modelo del mundo", que puede simular el proceso de ejecución del código, predecir los cambios de estado de las variables y avanzar...
Neovate Code - El asistente de programación inteligente de Ant Open Source
Neovate Code es un asistente de programación inteligente de código abierto del Departamento de Tecnología de Experiencia Alipay de Ant Group, que mejora la eficiencia del desarrollo mediante tecnología de inteligencia artificial. Con funciones de desarrollo conversacional, los desarrolladores pueden describir los requisitos a través del lenguaje natural, Neovate Code puede entender y generar la generación correspondiente....
Audio2Face: el modelo de generación de animaciones faciales 3D de NVIDIA de código abierto
Audio2Face es una herramienta de IA de código abierto de NVIDIA capaz de transformar la señal de audio en animaciones faciales realistas en 3D. Mediante el análisis de las características del habla en el audio, como los fonemas y la entonación, genera una sincronización precisa de los labios y sutiles expresiones emocionales para dotar de viveza humana a los personajes virtuales.
Qwen3-VL - Macromodelos de lenguaje visual multimodal de código abierto AliCloud Tongyi Qianqian
Qwen3-VL es un gran modelo de lenguaje visual multimodal de código abierto del equipo AliCloud Tongyi Qianqian, con 235.000 millones de referencias y unos 471 GB de archivos de modelo.Contiene versiones de instrucción y pensamiento, adopta el diseño intercalado MRope mejorado, DeepStack y otras tecnologías, que pueden utilizar eficazmente transformaciones visuales....
Qwen3Guard - Modelo de seguridad de código abierto Ali Qwen
Qwen3Guard es un modelo de protección de seguridad afinado basado en el modelo base Qwen3, diseñado para la detección de seguridad. Proporciona una categorización de seguridad precisa de las solicitudes y respuestas, proporciona niveles de riesgo y es compatible con entornos en inglés, chino y multilingües.Qwen3Guard está disponible en dos pro...









