AI分享圈

AI正在改变世界!
Mistral Vibe - Mistral AI推出的开源命令行编码助手

Mistral Vibe - Mistral AI推出的开源命令行编码助手

Mistral Vibe是Mistral AI推出的开源命令行编码助手,基于Devstral模型开发,支持自然语言交互完成代码搜索、文件操作、版本控制等任务。能自动扫描项目结构和Git状态,通过@符号...
5个月前
032.7K
GLM-TTS - 智谱AI推出的开源工业级语音合成系统

GLM-TTS - 智谱AI推出的开源工业级语音合成系统

GLM-TTS 是智谱推出的开源工业级语音合成系统,具备强大的语音合成能力。采用两阶段生成架构:第一阶段将文本转换为语音令牌序列,第二阶段将令牌序列转换为高质量音频。系统支持仅用3秒语音样本即可完成音...
5个月前
032.6K
Devstral 2 - Mistral AI 推出的新一代编程模型家族

Devstral 2 - Mistral AI 推出的新一代编程模型家族

Devstral 2是Mistral AI 推出的针对软件工程任务设计的新一代编程模型家族,包含 Devstral 2(123B 参数)和 Devstral Small 2(24B 参数)两个版本。D...
5个月前
031.4K
GLM-ASR - 智谱AI开源的高性能语音识别模型系列

GLM-ASR - 智谱AI开源的高性能语音识别模型系列

GLM-ASR是智谱AI开源的高性能语音识别模型系列,包含云端模型GLM-ASR-2512和开源端侧模型GLM-ASR-Nano-2512。GLM-ASR-2512是全球领先的云端语音识别模型,支持多...
5个月前
038.4K
OpenAutoGLM - 智谱AI开源的手机AI Agent模型

OpenAutoGLM - 智谱AI开源的手机AI Agent模型

OpenAutoGLM 是智谱AI开源的具有“手机使用”能力的智能体模型,能通过多模态感知理解手机屏幕内容,自动生成操作流程来完成用户指定的任务。用户只需用自然语言描述需求,如“打开美团搜索附近的火锅...
5个月前
033.4K
SurfSense - 开源的AI研究与知识管理工具,NotebookLM最强平替

SurfSense - 开源的AI研究与知识管理工具,NotebookLM最强平替

SurfSense 是开源的 AI 研究与知识管理工具。高度可定制,能连接搜索引擎、Slack、Jira、Notion、YouTube、GitHub 等众多外部数据源,方便用户整合信息。用户可上传多种...
5个月前
031.3K
GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V是智谱AI开源的多模态大语言模型系列,系列包含两个版本:GLM-4.6V(106B-A12B),面向云端与高性能集群场景的基础版,采用混合专家(MoE)架构,总参数量约1060亿,激活...
5个月前
028.9K
InkSight - Google开源的AI手写识别工具

InkSight - Google开源的AI手写识别工具

InkSight是Google开源的AI手写识别工具,能将纸质手写笔记转换为可编辑的数字墨迹文件(如SVG格式)。与传统OCR不同,能识别文字内容,能还原笔迹样式、段落结构和重点标记,支持多语言处理。
5个月前
028K
NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1是NewBieAI-Lab团队开源的首个实验性动漫文生图模型,采用3.5B参数的Next-DiT架构,专为二次元风格优化。模型通过双文本编码器(GEMMA3-4B...
6个月前
031.1K
LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image是美团LongCat团队发布的开源图像生成与编辑模型。采用混合骨干架构(MM-DiT+Single-DiT),结合视觉语言模型(VLM)条件编码器,能实现文生图和多轮图像编辑...
6个月前
026.8K