AI分享圈

AI正在改变世界!
TalkCody - 免费开源的AI编程桌面助手,支持复杂任务

TalkCody - 免费开源的AI编程桌面助手,支持复杂任务

TalkCody是免费开源的AI编程助手桌面应用,基于Rust + Tauri 2构建,支持Windows、macOS和Linux三大平台,具有原生性能、快速启动和低资源占用的优势。支持50多种主流A...
2天前
04.1K
MemMachine - MemVerge推出的开源AI记忆系统

MemMachine - MemVerge推出的开源AI记忆系统

MemMachine是MemVerge公司开发的开源AI记忆系统,专为AI大模型和智能体设计,能像人脑一样存储和回忆交互数据,解决AI“无状态失忆”问题。采用分层架构(短期记忆、长期记忆、用户画像...
2天前
04.5K
PartCrafter - 北大联合字节开源的单图3D生成模型

PartCrafter - 北大联合字节开源的单图3D生成模型

PartCrafter 是先进的 3D 生成模型,由北京大学、字节跳动和卡耐基梅隆大学联合提出。能从单张 RGB 图像中一次性生成多个语义明确且几何形态各异的 3D 网格部件。模型通过组合式潜在空间和...
3天前
03.3K
GigaWorld-0 - 极佳视界开源的世界模型框架

GigaWorld-0 - 极佳视界开源的世界模型框架

GigaWorld-0是国内具身智能创业公司极佳视界(GigaAI)开源的世界模型框架,主要用于解决具身智能(Embodied AI)领域的数据瓶颈问题。高效生成高质量、多样化且物理真实的训练数据,推...
3天前
03.3K
Mistral 3 - Mistral AI发布开源的最新多模态大模型系列

Mistral 3 - Mistral AI发布开源的最新多模态大模型系列

Mistral 3是Mistral AI发布开源的最新多模态大模型系列,包含旗舰模型Mistral Large 3(675B总参数)和轻量版Ministral系列(3B/8B/14B),均支持图像理解...
3天前
03.6K
Vidi2 - 字节跳动开源的多模态视频理解与生成大模型

Vidi2 - 字节跳动开源的多模态视频理解与生成大模型

Vidi2是字节跳动开源的第二代多模态视频理解与生成大模型,专注于视频内容的理解、分析和创作。支持文本、视频、音频三种模态的联合输入,能同时理解画面内容、声音信息以及自然语言指令,实现跨模态的交互与推...
3天前
04.1K
Alpamayo-R1 - 英伟达开源的带推理能力的视觉-语言-行动模型

Alpamayo-R1 - 英伟达开源的带推理能力的视觉-语言-行动模型

Alpamayo-R1是英伟达研发的具有推理能力的视觉-语言-行动(VLA)模型,专为提升自动驾驶在复杂场景中的决策能力设计。通过引入因果链推理机制,让车辆能像人类驾驶员一样分析场景因果关系(如“因前...
3天前
09.6K
Ovis-Image - 阿里AIDC-AI团队开源的文生图模型

Ovis-Image - 阿里AIDC-AI团队开源的文生图模型

Ovis-Image 是阿里巴巴国际数字商务集团 AIDC-AI 团队开源的 70 亿参数文生图模型,专注于高质量文本渲染。基于 Ovis-U1 架构,继承了先进的视觉解码器和双向 Token 精炼器...
4天前
04.8K
悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

悟界·Emu3.5是北京智源人工智能研究院开源的多模态世界大模型,参数量达340亿,具备原生世界建模能力。通过10万亿多模态Token(含790年视频数据)训练,能模拟物理规律,实现图文生成、视觉指导...
4天前
04.3K
GELab-Zero - 阶跃团队开源的端侧多模态GUI Agent模型

GELab-Zero - 阶跃团队开源的端侧多模态GUI Agent模型

GELab-Zero是阶跃团队开源的端侧多模态GUI Agent模型,基于Qwen3-VL-4B-Instruct基座模型构建,参数量为4B。能识别UI元素并执行点击、滑动等操作,支持跨应用任务处理...
5天前
07.9K