AI分享圈

AI正在改变世界!
GLM-ASR - 智谱AI开源的高性能语音识别模型系列

GLM-ASR - 智谱AI开源的高性能语音识别模型系列

GLM-ASR是智谱AI开源的高性能语音识别模型系列,包含云端模型GLM-ASR-2512和开源端侧模型GLM-ASR-Nano-2512。GLM-ASR-2512是全球领先的云端语音识别模型,支持多...
6小时前
01K
OpenAutoGLM - 智谱AI开源的手机AI Agent模型

OpenAutoGLM - 智谱AI开源的手机AI Agent模型

OpenAutoGLM 是智谱AI开源的具有“手机使用”能力的智能体模型,能通过多模态感知理解手机屏幕内容,自动生成操作流程来完成用户指定的任务。用户只需用自然语言描述需求,如“打开美团搜索附近的火锅...
1天前
03.2K
SurfSense - 开源的AI研究与知识管理工具,NotebookLM最强平替

SurfSense - 开源的AI研究与知识管理工具,NotebookLM最强平替

SurfSense 是开源的 AI 研究与知识管理工具。高度可定制,能连接搜索引擎、Slack、Jira、Notion、YouTube、GitHub 等众多外部数据源,方便用户整合信息。用户可上传多种...
1天前
02.2K
GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V是智谱AI开源的多模态大语言模型系列,系列包含两个版本:GLM-4.6V(106B-A12B),面向云端与高性能集群场景的基础版,采用混合专家(MoE)架构,总参数量约1060亿,激活...
1天前
02.9K
InkSight - Google开源的AI手写识别工具

InkSight - Google开源的AI手写识别工具

InkSight是Google开源的AI手写识别工具,能将纸质手写笔记转换为可编辑的数字墨迹文件(如SVG格式)。与传统OCR不同,能识别文字内容,能还原笔迹样式、段落结构和重点标记,支持多语言处理。
1天前
02.5K
NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1是NewBieAI-Lab团队开源的首个实验性动漫文生图模型,采用3.5B参数的Next-DiT架构,专为二次元风格优化。模型通过双文本编码器(GEMMA3-4B...
2天前
03.8K
LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image是美团LongCat团队发布的开源图像生成与编辑模型。采用混合骨干架构(MM-DiT+Single-DiT),结合视觉语言模型(VLM)条件编码器,能实现文生图和多轮图像编辑...
2天前
03.1K
VibeVoice-Realtime - 微软开源的轻量级实时文本转语音模型

VibeVoice-Realtime - 微软开源的轻量级实时文本转语音模型

VibeVoice-Realtime 是微软开源的轻量级实时文本转语音(TTS)模型,专为低延迟和实时交互设计。支持流式文本输入,从第一个文本 token 开始就能发声,延迟仅约300毫秒,适合动态数...
3天前
06K
Flowra - 魔搭联合呜哩WULI团队开源的AI工作流开发工具

Flowra - 魔搭联合呜哩WULI团队开源的AI工作流开发工具

Flowra 是 ModelScope 联合呜哩 WULI 团队开源图执行引擎和节点包开发工具,是 FlowBench 的核心组件。通过有向无环图(DAG)组织工作流,具备智能缓存、并行调度、分布式支...
4天前
06.4K
RoboCOIN - 智源联合多所高校开源的双臂机器人真机数据集

RoboCOIN - 智源联合多所高校开源的双臂机器人真机数据集

RoboCOIN是北京智源人工智能研究院联合多家企业和高校开源的全球首个大规模双臂机器人真机数据集,包含15种机器人平台、18万条真实操作轨迹和421种任务场景。最大特点是采用分层标注体系,将任务拆解...
4天前
06K