AI分享圈

AI正在改变世界!
Yume1.5 - 上海AI Lab联合复旦大学开源的交互式世界生成模型

Yume1.5 - 上海AI Lab联合复旦大学开源的交互式世界生成模型

Yume1.5是开源的交互式世界生成模型,由上海人工智能实验室、复旦大学、上海创新研究院联合开发,能实现实时交互渲染(单卡12 FPS)。采用了联合时空通道建模(TSCM)技术,即使上下文长度增加也能...
3个月前
028.8K
AutoMV - M-A-P联合北邮、南大等开源的免费音乐视频生成系统

AutoMV - M-A-P联合北邮、南大等开源的免费音乐视频生成系统

AutoMV是M-A-P团队联合多所高校研发的开源音乐视频生成系统,能在无需训练的情况下根据完整歌曲自动生成连贯的MV。采用多智能体协作模式,包含音乐分析、编剧、导演和质检等模块,能精准解析歌词、节拍...
3个月前
031.3K
Tencent-HY-MT1.5 - 腾讯混元开源的翻译模型系列

Tencent-HY-MT1.5 - 腾讯混元开源的翻译模型系列

Tencent-HY-MT1.5是腾讯混元开源的翻译模型1.5版本,包含1.8B和7B两个模型,支持33种国际语言及5种民汉/方言互译。1.8B模型专为手机等消费级设备优化,仅需1GB内存即可实现端侧...
3个月前
037.9K
PersonaLive - 澳门大学等开源的实时AI人像动画生成直播框架

PersonaLive - 澳门大学等开源的实时AI人像动画生成直播框架

PersonaLive是开源的实时AI换脸直播框架,由澳门大学、dzine.ai和大湾区大学GVC实验室联合开发。能在普通消费级显卡(12GB显存)上实现低延迟、高帧率的数字人驱动,支持通过摄像头实时...
3个月前
030.4K
Computer Use Preview - Google开源的AI浏览器自动化工具

Computer Use Preview - Google开源的AI浏览器自动化工具

Computer Use Preview是Google开源的基于Gemini模型的AI浏览器自动化工具,通过自然语言指令实现网页交互操作。采用"截图→分析→执行"的视觉识别流程,支持Playwrigh...
3个月前
025.6K
ClipSketch AI - 开源的AI视频转手绘分镜工具,支持B站、小红书

ClipSketch AI - 开源的AI视频转手绘分镜工具,支持B站、小红书

ClipSketch AI是开源的视频转手绘分镜工具,专为短视频创作者设计。能将B站、小红书等平台的视频一键转换为手绘风格故事板,支持标记关键帧、自动生成分镜和社交文案,能融合用户自定义角色。
3个月前
030.8K
MAI-UI - 阿里通义实验室开源的通用GUI智能体基座模型

MAI-UI - 阿里通义实验室开源的通用GUI智能体基座模型

MAI-UI是阿里巴巴通义实验室开源的通用GUI智能体基座模型,具备跨应用操作、模糊语义理解、主动用户交互和多步骤流程协调四大能力。采用端云协同架构,轻量模型驻守设备处理日常任务,复杂任务可调用云端大...
3个月前
034.5K
MiniMax M2.1 - MiniMax开源的编码和代理模型

MiniMax M2.1 - MiniMax开源的编码和代理模型

MiniMax M2.1 是MiniMax开源的编码和代理模型,拥有100亿激活量,支持多种主流编程语言,如 Rust、Java、Golang、C++、Kotlin、Objective-C、TypeS...
3个月前
022.2K
InstanceAssemble - 小红书联合复旦大学开源的布局控制生成技术

InstanceAssemble - 小红书联合复旦大学开源的布局控制生成技术

InstanceAssemble是小红书和复旦大学联合开源的布局控制生成技术,通过“实例组装注意力”机制,实现了从简单到复杂、从稀疏到密集布局的精准图像生成。采用两阶段级联架构,先生成图像背景,再逐个...
3个月前
018.9K
Zen Browser - 基于Firefox内核的开源AI网页浏览器

Zen Browser - 基于Firefox内核的开源AI网页浏览器

Zen Browser是基于Firefox内核的开源浏览器,主打简洁高效的浏览体验,核心特色是垂直标签栏和工作区隔离功能。采用侧边栏设计,能清晰展示50+个标签页的完整标题,支持多窗口分屏浏览。
3个月前
030.2K