AI分享圈

AI正在改变世界！

文章487 网址273 书籍0 软件0 评论0

已发布487

NitroGen - 英伟达联合斯坦福大学、加州理工等开源的游戏AI模型

NitroGen是英伟达联合斯坦福大学、加州理工学院等机构研发的开源游戏AI模型，能玩转超1000款不同类型游戏。模型基于GROOT N1.5架构，通过分析4万小时游戏视频数据（含手柄操作标注），实现...

最新AI资源

7个月前

058.1K

Qwen-Image-Layered - 阿里团队开源的AI图像编辑模型

Qwen-Image-Layered是阿里团队开源的AI图像编辑模型，能将普通图片智能分解为独立的透明图层，实现类似Photoshop的精准编辑。模型采用Apache 2.0协议开源，支持灵活控制图层...

最新AI资源

7个月前

058.8K

VTP - MiniMax海螺视频团队开源的视觉生成模型技术

VTP（Visual Tokenizer Pre-training）是MiniMax海螺视频团队提出的视觉生成模型关键技术，通过改进视觉分词器（tokenizer）的预训练方法提升生成系统性能。传统方...

最新AI资源

7个月前

054.4K

T5Gemma 2 - 谷歌开源的新一代编码器-解码器模型

T5Gemma 2 是谷歌开源的新一代编码器 - 解码器模型，基于 Gemma 3 架构升级而来，具备多模态和长上下文处理能力。支持文本和图像等多种数据类型，能处理超长上下文（最高 128K），在生成...

最新AI资源

7个月前

049K

FunctionGemma - 谷歌开源专为函数调用优化的轻量级AI模型

FunctionGemma是谷歌推出的专为函数调用优化的轻量级AI模型，基于2.7亿参数的Gemma 3基础模型开发，可在手机、浏览器等设备上实时将自然语言转换为可执行API指令。核心特点是支持本地离...

最新AI资源

7个月前

048.8K

SHARP - 苹果开源的单目视图3D场景合成技术

SHARP（Sharp Monocular View Synthesis in Less Than a Second）是苹果开源的单目视图合成技术。能从单张照片快速生成逼真的3D场景表示，仅需不到一秒...

最新AI资源

7个月前

053K

TRELLIS.2 - 微软开源的大型3D生成模型

TRELLIS.2是微软开源的大型3D生成模型，拥有40亿参数，专注于高保真图像到3D的生成。采用创新的“O-Voxel”稀疏体素结构，能高效处理复杂拓扑和锐利特征，生成具有全PBR材质的高质量3D资...

最新AI资源

7个月前

060.5K

Step-GUI - 阶跃星辰开源的AI Agent系列模型

Step-GUI是阶跃星辰公司开源的AI Agent系列模型，包括云端模型Step-GUI、首个面向GUI Agent的MCP协议，以及业内首个支持手机部署的开源端侧模型Step-GUI Edge。专...

最新AI资源

7个月前

059.4K

A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI（Agent-to-User Interface）是谷歌开源的Agent驱动型界面协议，解决AI代理生成复杂交互界面的难题。通过一种声明式JSON格式，让AI代理描述用户界面的结构，客户端应用...

最新AI资源

7个月前

064.3K

SAM Audio - Meta推出的开源多模态音频分割模型

SAM Audio是Meta推出的开源多模态音频分割模型，从复杂的音频混合中精准分离出任意目标声音。通过结合文本、视觉和时间维度的提示，实现灵活、高效的音频处理，为音频编辑、去噪、声音提取等任务提供了...

最新AI资源

7个月前

051.5K

加载更多