Círculo de intercambio de inteligencia artificial

Puesta en común diaria de los últimos productos, proyectos, marcos, interpretaciones de documentos, etc.~ sobre IA.
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - El eficiente modelo VLA de Amoy Group

CombatVLA es un innovador modelo 3D específico para juegos de rol de acción (ARPG) del equipo Future Life Lab del grupo Amoy.CombatVLA es un modelo de visión-lingüística-acción (VLA), construido a escala paramétrica 3B, que recoge la información del jugador humano a través del rastreador de movimiento....
hace 2 meses
019.6K
DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - El último modelo de IA de código abierto de DeepSeek

DeepSeek V3.1 es una nueva generación de modelos de inteligencia artificial presentada por DeepSeek, con importantes mejoras basadas en su predecesora, la V3. DeepSeek V3.1 introduce una arquitectura de razonamiento híbrida que permite al modelo alternar con flexibilidad entre los modos de pensamiento y no pensamiento, mejorando significativamente la...
hace 2 meses
021.2K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - Modelo de edición de imágenes de código abierto Ali Tongyi

Qwen-Image-Edit es un modelo de edición de imágenes polivalente introducido por Ali Tongyi, basado en la arquitectura Qwen-Image con 20.000 millones de parámetros. El modelo combina capacidades de edición semántica y de apariencia, y puede realizar ediciones de apariencia visual de bajo nivel en imágenes (por ejemplo, añadir, eliminar...
hace 2 meses
021K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS: el último marco de generación de voz de KunlunWei

MoE-TTS es un marco de síntesis del habla introducido por KunlunWanwei, basado en la arquitectura Mixed Expert (MoE), que combina Large Language Models (LLMs) preentrenados con módulos expertos del habla.MoE-TTS conserva el potente razonamiento textual congelando los parámetros del módulo textual y actualizando sólo los parámetros del módulo del habla....
hace 2 meses
022.7K
Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 - Modelos avanzados de creación musical por IA de Quintessence

Mureka V7.5 es un modelo de generación musical de IA de última generación de Kunlun World Wide, centrado en la composición de canciones chinas. El modelo reproduce con precisión el timbre y las técnicas de interpretación para generar voces naturales, suaves y emotivas. Basado en la tecnología optimizada de reconocimiento automático del habla (ASR), Mureka V...
hace 2 meses
022.1K
Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

Skywork Deep Research Agent v2 - Una versión mejorada de la Inteligencia de Investigación Profunda de Kunlun

Skywork Deep Research Agent v2 es un organismo inteligente de investigación profunda lanzado por Kunlun Wave, centrado en la integración y el análisis de información multimodal.Skywork Deep Research Agent v2 puede procesar texto, gráficos...
hace 2 meses
019.5K
Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft - Marco de código abierto de Tencent Hunyuan para generar vídeo interactivo para juegos de nueva generación.

Hunyuan-GameCraft es el marco de generación de vídeo de juegos interactivos de código abierto del equipo Tencent Hunyuan. Marco de una sola imagen y le pide que genere vídeo de juego altamente dinámico , apoyar al usuario a través del teclado y el ratón para controlar el contenido de vídeo en tiempo real .
hace 2 meses
024.8K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - Modelado multimodal eficiente de código abierto por KunlunWanwei

Skywork UniPic 2.0 es un eficiente modelo multimodal de código abierto de Quintessence, centrado en la generación, edición y comprensión de imágenes. El modelo se basa en una arquitectura SD3.5-Medium de 2B parámetros, y se realiza mediante pre-entrenamiento, estrategia de refuerzo progresivo de doble tarea y co-entrenamiento....
hace 2 meses
022.6K
RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

RynnRCP - Primer protocolo de contexto robótico de código abierto del Instituto Ali Dharma

RynnRCP es un protocolo de contexto robótico (RCP, Robot Context Protocol) de código abierto del Instituto Ali Dharma que reduce el umbral para el desarrollo de la inteligencia incorporada y abre todo el proceso de desarrollo.
hace 2 meses
023.1K
RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - El modelo de comprensión del mundo de código abierto del Instituto Ali Dharma

RynnEC es un modelo de comprensión del mundo presentado por el Instituto Dharma de Alibaba, centrado en tareas de inteligencia incorporada. El modelo se basa en una tecnología de fusión multimodal que combina datos de vídeo y lenguaje natural, y puede analizar objetos de una escena desde múltiples dimensiones, lo que permite funciones como la comprensión de objetos, la percepción espacial y la segmentación de objetivos de vídeo.
hace 2 meses
022.3K