CombatVLA - 淘天集团推出的高效VLA模型
CombatVLA是淘天集团未来生活实验室团队推出的创新3D动作角色扮演游戏(ARPG)专用模型。CombatVLA是视觉-语言-动作(VLA)模型,基于3B参数规模构建,通过动作追踪器收集人类玩家的...
DeepSeek V3.1 - DeepSeek推出的最新开源AI模型
DeepSeek V3.1是DeepSeek推出的新一代AI模型,在前代V3模型的基础上进行重要升级。DeepSeek V3.1引入混合推理架构,让模型在思考模式和非思考模式之间灵活切换,显著提高思考...
Qwen-Image-Edit - 阿里通义开源的图像编辑模型
Qwen-Image-Edit 是阿里通义推出的全能图像编辑模型,基于 200 亿参数的 Qwen-Image 架构构建。模型融合语义与外观的双重编辑能力,能对图像进行低层次的视觉外观编辑(如添加、删...
MoE-TTS - 昆仑万维推出的最新语音生成框架
MoE-TTS 是昆仑万维推出的语音合成框架,基于混合专家(MoE)架构,将预训练的大型语言模型(LLM)与语音专家模块结合。MoE-TTS 通过冻结文本模块参数、仅更新语音模块参数,保留强大的文本理...
Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型
Mureka V7.5 是昆仑万维推出的先进 AI 音乐生成模型,专注于中文歌曲创作。模型能精准还原音色与演奏技法,生成自然流畅且富有情感的歌声。基于优化的自动语音识别(ASR)技术,Mureka V...
Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版
Skywork Deep Research Agent v2 是昆仑万维推出的深度研究智能体,专注于多模态信息的整合与分析。Skywork Deep Research Agent v2 能处理文本、图...
Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架
Hunyuan-GameCraft 是腾讯 Hunyuan 团队开源的交互式游戏视频生成框架。框架能从单张图片和提示生成高动态的游戏视频,支持用户通过键盘和鼠标实时控制视频内容。
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型
Skywork UniPic 2.0 是昆仑万维开源的高效多模态模型,专注于图像生成、编辑与理解。模型基于 2B 参数的 SD3.5-Medium 架构,通过预训练、渐进式双任务强化策略和联合训练,实...
RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议
RynnRCP 是阿里达摩院开源的机器人上下文协议,能降低具身智能开发门槛并打通开发全流程。RynnRCP 包含 RCP 框架和 RobotMotion 模块。RCP 框架通过能力抽象和多协议支持,将...
RynnEC - 阿里达摩院开源的世界理解模型
RynnEC是阿里巴巴达摩院推出的世界理解模型,专注于具身智能任务。模型基于多模态融合技术,结合视频数据和自然语言,能从多个维度解析场景中的物体,支持物体理解、空间感知和视频目标分割等功能。