Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型
Intern-S1-mini 是上海人工智能实验室推出的轻量化科学多模态大模型,参数规模为 8B。继承了 Intern-S1 的强大能力,兼具通用与专业科学能力,适合快速部署和二次开发。在性能方面,I...
Nano Banana - 谷歌推出的AI图像编辑模型
Nano Banana 是谷歌推出的 AI 图像生成与编辑模型Gemini 2.5 Flash Image代号,能根据简单的文本提示生成细节丰富、光影真实的图像,对现有图像进行高质量的修改。
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台
Genie Envisioner(GE)是智元机器人团队联合新加坡国立大学、北京航空航天大学等机构开发的机器人操作统一平台。通过“先想象,后行动”的方式,让机器人更好地理解和执行任务。
DINOv3 - Meta AI推出的新一代自监督视觉基础模型
DINOv3 是 Meta AI 推出的新一代自监督视觉基础模型,采用自监督学习范式,无需标注数据即可学习图像特征。通过改进数据准备和引入 Gram anchoring 解决了特征退化问题,提升了泛化...
Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型
Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研交互式世界模型。是业内首个开源的通用场景实时长序列交互式生成模型,模型通过视觉驱动的交互方案,能以 25 FPS 的速度在多...
Baichuan-M2 - 百川智能推出开源的医疗增强大模型
Baichuan-M2 是百川智能推出的开源医疗增强大模型。在医疗领域表现出色,特别是在HealthBench评测中以60.1分的成绩超越了OpenAI的gpt-oss120b等众多开源模型,成为全球...
Qwen-Flash - 通义千问推出的高性能、低成本语言模型
Qwen-Flash 是阿里巴巴通义千问系列推出的高性能、低成本的语言模型,专为快速响应和高效处理简单任务设计。基于先进的 Mixture-of-Experts (MoE) 架构,通过稀疏专家网络实现...
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具
SkyReels-A3 是昆仑万维集团推出的音频驱动数字人创作工具。能通过简单的输入(如人像图片和语音)生成高质量的动态视频内容,让静态照片“活”起来,可以为现有视频更换台词,人物会自动对上新的口型...
MiniMax Speech 2.5 - MiniMax推出的语音生成模型
MiniMax Speech 2.5 是 MiniMax 团队开发的先进语音生成模型。在语音合成领域取得了显著进步,尤其在多语种表现力、音色复刻精度和语种覆盖范围上实现了飞跃。模型支持 40 种语言...
GPT-5 - OpenAI推出的最强语言模型,统一智能系统
GPT-5是OpenAI最新发布的语言模型,具有多项升级。是一个统一智能系统,内置实时路由器,能根据问题复杂度自动切换高效模式与深度思考模式,实现快速响应与精准解答。GPT-5拥有多个版本,包括面向普...