AI分享圈

AI正在改变世界!
Ling-1T - 蚂蚁集团开源的万亿参数通用语言模型

Ling-1T - 蚂蚁集团开源的万亿参数通用语言模型

Ling-1T是蚂蚁集团开源的万亿参数通用语言模型,属于百灵大模型Ling 2.0系列的旗舰产品。模型采用高效MoE架构,支持128K上下文窗口,在代码生成、数学推理、逻辑测试等7项基准中超越GPT...
4小时前
0727
聆音EchoCare - 香港科学院开源的超声基座大模型

聆音EchoCare - 香港科学院开源的超声基座大模型

聆音EchoCare是中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)研发的超声基座大模型,基于全球最大的超声影像数据集(超450万张图像)训练而成,覆盖多中心、多地区、多人种及50余个人...
8小时前
0777
Code2Video - Show Lab开源的AI教学视频生成框架

Code2Video - Show Lab开源的AI教学视频生成框架

Code2Video是创新的开源项目,能将代码片段自动转换为高质量的视频内容(mp4格式)。项目通过独特的代码中心范式,使用carbon-now-cli工具将代码生成精美的图片,利用ffmpeg将这些...
1天前
02.8K
SceneGen - 上海交大开源的单图像生成3D场景框架

SceneGen - 上海交大开源的单图像生成3D场景框架

SceneGen是上海交通大学开源的单图像生成3D场景的方法,从单张场景图像及目标资源蒙版中,高效生成包含多个3D资源的完整场景,包括资源的几何结构、纹理及相对空间位置。
1天前
02K
Ming-UniAudio - 蚂蚁开源的统一音频多模态生成模型

Ming-UniAudio - 蚂蚁开源的统一音频多模态生成模型

Ming-UniAudio是蚂蚁集团开源的统一音频多模态生成模型,支持文本、音频、图像和视频的混合输入与输出。采用多尺度Transformer和混合专家(MoE)架构,通过模态感知路由机制高效处理跨模...
2天前
04.1K
AIMangaStudio - 免费的AI漫画创作工具,提供完整创作流程

AIMangaStudio - 免费的AI漫画创作工具,提供完整创作流程

AIMangaStudio是免费的AI漫画创作工具,为创作者提供完整的漫画创作流水线,包括剧情生成、分镜设计、角色设定等功能,能简化从脚本到漫画页面的制作流程。支持自然语言生成漫画脚本,包括剧情、对白...
3天前
05.8K
FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat 是小红书开源的全双工语音交互系统,具有实时双向对话能力,支持可控打断功能。采用模块化设计,包括转录控制模块、交互模块和对话管理器等,支持级联和半级联架构,可灵活部署。
5天前
07.2K
Logics-Parsing - 阿里开源的文档解析模型

Logics-Parsing - 阿里开源的文档解析模型

Logics-Parsing 是阿里开源的端到端文档解析模型,基于 Qwen2.5-VL-7B。通过强化学习优化文档布局分析和阅读顺序推断,能将 PDF 图像转换为结构化 HTML 输出,支持多种内容...
6天前
09.7K
Ring-1T-preview - 蚂蚁集团开源的万亿参数大模型

Ring-1T-preview - 蚂蚁集团开源的万亿参数大模型

Ring-1T-preview 是蚂蚁集团开源的万亿参数大模型,基于 Ling 2.0 MoE 架构,在 20T 语料上预训练,并通过自研强化学习系统 ASystem 进行推理能力训练。在自然语言推理...
1周前
09.8K
RoboBrain-X0 - 智源研究院开源的零样本跨本体泛化具身模型

RoboBrain-X0 - 智源研究院开源的零样本跨本体泛化具身模型

RoboBrain-X0是智源研究院开源的全球首个支持零样本跨本体泛化的开源具身模型,具有重要的行业意义。能在无需微调的情况下,驱动多种不同构造的真实机器人完成基础操作任务,在少量样本微调后展现出对复...
1周前
08.4K