AI分享圈

AI正在改变世界!
ToonComposer - 腾讯开源的生成式AI动画制作工具

ToonComposer - 腾讯开源的生成式AI动画制作工具

ToonComposer 是香港中文大学、腾讯 PCG ARC 实验室和北京大学共同推出的生成式 AI 动画制作工具。通过生成式后关键帧技术,将中间帧生成和上色环节整合为自动化流程,仅需一个草图和一个...
8个月前
053.3K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini 是上海人工智能实验室推出的轻量化科学多模态大模型,参数规模为 8B。继承了 Intern-S1 的强大能力,兼具通用与专业科学能力,适合快速部署和二次开发。在性能方面,I...
8个月前
043.9K
Nano Banana - 谷歌推出的AI图像编辑模型

Nano Banana - 谷歌推出的AI图像编辑模型

Nano Banana 是谷歌推出的 AI 图像生成与编辑模型Gemini 2.5 Flash Image代号,能根据简单的文本提示生成细节丰富、光影真实的图像,对现有图像进行高质量的修改。
7个月前
069.7K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner(GE)是智元机器人团队联合新加坡国立大学、北京航空航天大学等机构开发的机器人操作统一平台。通过“先想象,后行动”的方式,让机器人更好地理解和执行任务。
8个月前
044.8K
DINOv3 - Meta AI推出的新一代自监督视觉基础模型

DINOv3 - Meta AI推出的新一代自监督视觉基础模型

DINOv3 是 Meta AI 推出的新一代自监督视觉基础模型,采用自监督学习范式,无需标注数据即可学习图像特征。通过改进数据准备和引入 Gram anchoring 解决了特征退化问题,提升了泛化...
8个月前
054.9K
Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研交互式世界模型。是业内首个开源的通用场景实时长序列交互式生成模型,模型通过视觉驱动的交互方案,能以 25 FPS 的速度在多...
8个月前
050.3K
Baichuan-M2 - 百川智能推出开源的医疗增强大模型

Baichuan-M2 - 百川智能推出开源的医疗增强大模型

Baichuan-M2 是百川智能推出的开源医疗增强大模型。在医疗领域表现出色,特别是在HealthBench评测中以60.1分的成绩超越了OpenAI的gpt-oss120b等众多开源模型,成为全球...
8个月前
050.5K
Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash 是阿里巴巴通义千问系列推出的高性能、低成本的语言模型,专为快速响应和高效处理简单任务设计。基于先进的 Mixture-of-Experts (MoE) 架构,通过稀疏专家网络实现...
8个月前
046.4K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 是昆仑万维集团推出的音频驱动数字人创作工具。能通过简单的输入(如人像图片和语音)生成高质量的动态视频内容,让静态照片“活”起来,可以为现有视频更换台词,人物会自动对上新的口型...
8个月前
041.9K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 是 MiniMax 团队开发的先进语音生成模型。在语音合成领域取得了显著进步,尤其在多语种表现力、音色复刻精度和语种覆盖范围上实现了飞跃。模型支持 40 种语言...
8个月前
049.1K