最新AI资源

共 3123 篇文章

课程资料最新AI资源 AI知识库 AI新闻

排序

SeedMusic 1.0 - 字节跳动推出的第一代AI音乐生成模型

SeedMusic 1.0 - 字节跳动推出的第一代AI音乐生成模型

SeedMusic 1.0是字节跳动推出的第一代AI音乐生成模型，专注于将用户的文字创意快速转化为带有人声的完整歌曲草稿。用户只需输入一段描述、歌词或风格方向，可在几分钟内生成包含主歌、副歌、编曲和人...

6天前

014.4K

跃迁维度 - AI 模型聚合服务平台，一个API统一调多款模型

跃迁维度 - AI 模型聚合服务平台，一个API统一调多款模型

跃迁维度（dimleap）是AI模型聚合服务平台，为全球开发者提供高效能、低成本的多品类AI模型API服务。平台目前已接入DeepSeek、GLM（智谱清言）、MiniMax、kimi、qwen（通...

6天前

07.5K

ChatExcel Ultra - ChatExcel团队推出的企业级AI数据智能体

ChatExcel Ultra - ChatExcel团队推出的企业级AI数据智能体

ChatExcel Ultra 是ChatExcel团队面向企业用户和专业数据办公场景推出的全新桌面版，定位为国内首款企业级AI数据智能体。

7天前

09.7K

Claude Sonnet 5 - Anthropic 发布的最具 Agent 能力模型

Claude Sonnet 5 - Anthropic 发布的最具 Agent 能力模型

Claude Sonnet 5是Anthropic 发布的最具 Agent 能力的 Sonnet 模型，以中端价格提供接近旗舰 Opus 4.8 的自主智能体能力。模型支持 100 万 token 上...

7天前

08.2K

Astryx - Meta 开源的 React 设计系统

Astryx - Meta 开源的 React 设计系统

Astryx 是 Meta 以 MIT 协议开源的 React 设计系统，历经八年内部打磨，长期支撑 Facebook、Instagram、WhatsApp 和 Threads 等超过 13,000 ...

7天前

08K

Claude Tag - Anthropic 推出的 Slack 原生 AI 协作功能

Claude Tag - Anthropic 推出的 Slack 原生 AI 协作功能

Claude Tag 是 Anthropic 推出的 Slack 原生 AI 协作功能，将 Claude 从个人聊天工具升级为团队常驻成员。用户只需在 Slack 频道中输入 @Claude 即可分配...

2周前

018.2K

Unlimited-OCR - 百度开源的端到端长文档 OCR 模型

Unlimited-OCR - 百度开源的端到端长文档 OCR 模型

Unlimited-OCR 是百度开源的端到端长文档 OCR 模型，采用 3B 参数 MoE 架构（每 token 仅激活约 500M 参数），核心创新在于将标准注意力替换为 R-SWA（参考滑动窗口...

2周前

014.2K

Seedance 2.5 - 字节跳动发布的最新一代 AI 视频生成模型

Seedance 2.5 - 字节跳动发布的最新一代 AI 视频生成模型

Seedance 2.5 是字节跳动发布的最新一代 AI 视频生成模型，目前已开启全球企业内测，预计 7 月初正式上线。在 2.0 版本基础上实现了多项关键突破，原生单段视频时长从 15 秒提升至 3...

2周前

016K

豆包2.1 - 字节跳动发布的最新旗舰大模型系列

豆包2.1 - 字节跳动发布的最新旗舰大模型系列

豆包2.1（Doubao-Seed-2.1）是字节跳动发布的最新旗舰大模型系列，包含Pro和Turbo两个版本，专为Coding与Agent时代打造。编程能力上，在Terminal Bench 2.1...

2周前

013.9K

SkillOpt - 微软研究院开源的 Agent 技能自进化框架

SkillOpt - 微软研究院开源的 Agent 技能自进化框架

SkillOpt 是微软研究院开源的 Agent 技能自进化框架，核心创新在于将自然语言编写的技能文档视为可训练的外部参数，无需修改底层大模型权重。系统通过"执行-反思-编辑-验证"闭环运作：冻结的目...

2周前

013.8K

Qwen-AgentWorld - 阿里通义实验室发布的首个原生语言世界模型

Qwen-AgentWorld - 阿里通义实验室发布的首个原生语言世界模型

Qwen-AgentWorld 是阿里巴巴通义实验室发布的首个原生语言世界模型（Language World Model, LWM）。与传统"提示进、动作出"的反应式智能体不同，核心逻辑是先预测环境会...

2周前

015.4K

Xiaomi MiMo Claw - 小米推出的云端轻量化 AI 智能体平台

Xiaomi MiMo Claw - 小米推出的云端轻量化 AI 智能体平台

Xiaomi MiMo Claw 是小米推出的云端轻量化 AI 智能体平台，基于 OpenClaw 框架打造，搭载自研 MiMo-V2.5-Pro 旗舰模型。主打"一键部署、零门槛"的 AI 办公体验...

3周前

019.2K

HiPilot - 小盒科技推出的 AI 原生经营操作系统

HiPilot - 小盒科技推出的 AI 原生经营操作系统

HiPilot 是小盒科技推出的 AI 原生经营操作系统，非传统意义上的 AI 助手或工具软件，是由 7 位专业 Agent 组成的 7×24 小时 AI 经营班子，能自主感知企业数据、分析经营态势...

3周前

017.6K

LOGOS - 阿里联合中国人大推出的多领域科学生成基础模型

LOGOS - 阿里联合中国人大推出的多领域科学生成基础模型

LOGOS（Language Of Generative Objects in Science）是阿里集团联合中国人民大学高瓴人工智能学院开发的首个基于统一"科学语法"的多领域科学生成基础模型。

3周前

015K

Meshy 3D Agent - Meshy 发布的全球首个 3D 创作 AI Agent

Meshy 3D Agent - Meshy 发布的全球首个 3D 创作 AI Agent

Meshy 3D Agent 是 AI 3D 公司 Meshy 发布的全球首个 3D 创作 AI Agent，通过对话式交互将 3D 创作从一次性生成推向可控、可复用的生产流程。与传统「输入提示词、输...

3周前

018.3K

Seedance 2.0 Mini - 字节跳动 Seedance 视频模型系列的轻量版本

Seedance 2.0 Mini - 字节跳动 Seedance 视频模型系列的轻量版本

Seedance 2.0 Mini 是字节跳动 Seedance 视频模型系列的最新轻量版本，在火山方舟体验中心及 Dreamina 平台上线，计划近期开放 API 服务。

3周前

014.2K

GLM-5.2 - 智谱最新推出的旗舰级开源大模型

GLM-5.2 - 智谱最新推出的旗舰级开源大模型

GLM-5.2 是智谱最新推出的旗舰级开源大模型，超长上下文理解和智能编程为核心卖点。模型具备百万级 token 的上下文处理能力，能一次性分析整个代码仓库或长篇技术文档。

4周前

022.1K

Gemini 3.5 Live Translate - Google 发布的最新实时语音翻译模型

Gemini 3.5 Live Translate - Google 发布的最新实时语音翻译模型

Gemini 3.5 Live Translate 是 Google 发布的最新实时语音翻译模型，支持 70 余种语言和 2,000 多组语言对，覆盖全球绝大多数语种。采用流式实时翻译技术，输出仅落后...

4周前

018.1K

DiffusionGemma - Google DeepMind 发布的实验性开源文本生成模型

DiffusionGemma - Google DeepMind 发布的实验性开源文本生成模型

DiffusionGemma 是 Google DeepMind 发布的实验性开源文本生成模型，采用离散文本扩散架构替代传统自回归方式。基于 Gemma 4 的 MoE 骨干（26B 总参数，激活 3...

4周前

018.1K

HiDream-O1-Image-1.5 - 智象未来推出的商用版图像生成大模型

HiDream-O1-Image-1.5 - 智象未来推出的商用版图像生成大模型

HiDream-O1-Image-1.5 是智象未来（HiDream.ai）推出的商用版图像生成大模型，在全球独立评测平台 Artificial Analysis 的文生图榜单（Text to Ima...

4周前

017.2K

html-video - Open Design团队开源的本地视频生成工具

html-video - Open Design团队开源的本地视频生成工具

html-video是Open Design团队开源的本地视频生成工具，能将HTML、CSS和数据直接转换为MP4视频。支持21种预设模板，涵盖产品宣传、知识讲解等场景，可配合Claude Code...

4周前

019K

Kimi K2.7 Code - 月之暗面Kimi开源的编程专用大模型

Kimi K2.7 Code - 月之暗面Kimi开源的编程专用大模型

Kimi K2.7 Code是月之暗面（Moonshot AI）发布并开源的编程专用大模型，属于Kimi K2系列的最新迭代版本。专为长上下文编程和复杂任务优化，聚焦代码生成、理解、调试及多文件项目架...

4周前

020.3K

Octask - 光魔科技推出的新一代 AI 原生内容工作室平台

Octask - 光魔科技推出的新一代 AI 原生内容工作室平台

Octask 是深圳光魔科技推出的新一代 AI 原生内容工作室平台，由谷歌与腾讯背景团队打造，获得百度 A 轮投资。核心创新在于将 AI 工具"员工化"，通过像素风格的沉浸式虚拟工作室，让创作者以"老...

4周前

016.7K

蛙蛙写作2.0升级深度解析：三栏架构如何重塑AI长篇创作体验

蛙蛙写作2.0升级深度解析：三栏架构如何重塑AI长篇创作体验

2025年7月，蛙蛙写作正式发布2.0版本，这是该产品自2024年上线以来幅度最大的一次产品重构。此次升级不仅在底层技术能力上实现了对主流大模型的深度整合，更在产品交互架构上做出了突破性的创新——引入...

4周前

018K

JoyAI-Echo - 京东开源的分钟级长音视频生成框架

JoyAI-Echo - 京东开源的分钟级长音视频生成框架

JoyAI-Echo 是京东开源的分钟级长音视频生成框架，专为解决AI视频"角色易崩、声音乱变、生成缓慢"三大痛点而设计。基于LTX-2.3 DiT架构，通过跨模态记忆库在长达5分钟的多镜头视频中保持...

4周前

019.7K

Meoo CLI - 阿里云Meoo秒悟团队推出的开源命令行工具

Meoo CLI - 阿里云Meoo秒悟团队推出的开源命令行工具

Meoo CLI是阿里云Meoo秒悟团队推出的开源命令行工具，是本地AI编程助手与云端能力之间的连接入口，让开发者无需手动处理复杂的云服务配置，即可实现项目的快速部署和上线。

4周前

019.7K

Claude Fable 5 - Anthropic发布的第五代大型语言模型

Claude Fable 5 - Anthropic发布的第五代大型语言模型

Claude Fable 5是Anthropic发布的第五代大型语言模型，属于其Claude系列，是首个面向公众开放的“Mythos级”（神话级）模型。

4周前

019.5K

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B是谷歌开源的多模态AI模型，采用无编码器架构，仅需16GB显存即可在消费级设备运行。取消传统视觉和音频编码器，通过轻量级嵌入模块直接处理原始数据，实现9GB显存占用下接近26B参...

1个月前

030.9K

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work 是月之暗面（Moonshot AI）公测的桌面端产品，为面向知识工作者的通用型本地 Agent。将 Kimi Code 在工程场景中验证过的本地 Agent 能力，迁移到普通知识工...

1个月前

027.9K

MAI-Code-1-Flash - 微软自研的 AI 编程模型

MAI-Code-1-Flash - 微软自研的 AI 编程模型

MAI-Code-1-Flash 是微软自研的AI编程模型，采用137B参数MoE架构，专为真实开发环境训练，直接使用GitHub Copilot的生产工具链学习多文件编辑、终端调用等实际工作流。

1个月前

025K

MAI-Thinking-1 - 微软AI发布的首款自研高级推理模型

MAI-Thinking-1 - 微软AI发布的首款自研高级推理模型

MAI-Thinking-1 是微软AI发布的首款自研高级推理模型。模型采用35B活跃参数、约1T总参数的稀疏混合专家（MoE）架构，拥有256K超长上下文窗口。完全基于干净且拥有商业许可的企业级数据...

1个月前

023.3K

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 是 NVIDIA 开源的首个完全开放的物理 AI 全模态模型，采用创新的 Mixture-of-Transformers（MoT）架构，将视觉推理、物理世界生成与动作预测统一在单一系...

1个月前

026.8K

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini是字节跳动开源的视频生成与编辑统一框架，采用"先理解，再生成"的协同架构：MLLM Planner深度解析文本指令与视觉输入，DiT Renderer将其转化为高质量连续视频。

1个月前

025.1K

语构 - 阿里达摩院推出的 AI 原生应用搭建平台

语构 - 阿里达摩院推出的 AI 原生应用搭建平台

语构是阿里达摩院推出的 AI 原生应用搭建平台，平台以"Create For What You Want"为理念，让用户无需编写代码即可快速创建各类应用。语构内置 AI 能力，支持通过自然语言描述需求...

1个月前

023.8K

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus 是阿里巴巴通义千问团队推出的多模态智能体基座模型，在 Qwen3.7 强大文本能力基础上全面升级视觉-语言理解能力，同时完整保留编码、工具调用与生产力工作流等智能体特性。

1个月前

024.9K

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3是稀宇科技发布的新一代人工智能大模型，采用自研稀疏注意力机制（MSA），支持100万tokens超长上下文和原生多模态功能（图像/视频输入及桌面操作）。编程能力在SWE-Bench...

1个月前

028.2K

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA 是阿里通义实验室发布的统一视觉-语言-动作（VLA）具身基础模型。以 Qwen3.5-4B 为视觉语言主干，搭配 1.15B 参数的 DiT（Diffusion Transforme...

1个月前

025.3K

Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

Step 3.7 Flash是阶跃星辰（StepFun）开源的新一代AI模型，专为生产级智能代理（Agent）设计。在速度、成本与复杂任务处理能力间取得平衡，支持编程、搜索和多模态工作流，并针对本地部...

1个月前

020.8K

阿里云百炼CLI - 阿里云 Model Studio 开源的命令行工具

阿里云百炼CLI - 阿里云 Model Studio 开源的命令行工具

阿里云百炼CLI（Bailian CLI）是阿里云Model Studio官方开源的命令行工具，通过一行命令即可让任意AI Agent自动调用阿里云百炼平台的150+款模型和10+款应用能力，涵盖文本...

1个月前

020.4K

Hy-Memory - 腾讯混元推出的记忆插件，为长期协作型 Agent 设计

Hy-Memory - 腾讯混元推出的记忆插件，为长期协作型 Agent 设计

Hy-Memory是腾讯混元推出的记忆插件，专为 Openclaw 等长期协作型 Agent 设计。通过 6层记忆框架 × System1/System2 双系统 × 演化链三层核心架构，解决 Ag...

1个月前

022.3K

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 是 Anthropic 推出的最新旗舰 AI 模型，在 Opus 4.7 基础上全面升级了编码、Agentic 推理与知识工作能力，新增动态工作流（Dynamic Wo...

1个月前

026.5K

ForgeTrain - 面壁智能联合清华大学、OpenBMB开源的大模型预训练框架

ForgeTrain - 面壁智能联合清华大学、OpenBMB开源的大模型预训练框架

ForgeTrain 是面壁智能联合清华大学、OpenBMB 开源社区发布的全球首个完全由 AI 编写、零人类代码介入的生产级大模型预训练框架。框架采用独创的 Forge Engineering（锻造...

1个月前

023.7K

omp - 开源的终端 AI Coding Agent

omp - 开源的终端 AI Coding Agent

omp（oh-my-pi）是开源的终端 AI Coding Agent，由 can1357 基于 Mario Zechner 的 Pi 项目扩展而来。不是简单的聊天式代码助手，是将终端、代码仓库、L...

1个月前

028K

Wall-OSS-0.5 - 自变量机器人开源的视觉-语言-动作大模型

Wall-OSS-0.5 - 自变量机器人开源的视觉-语言-动作大模型

Wall-OSS-0.5 是自变量机器人（X Square Robot）推出的开源视觉-语言-动作（VLA）大模型，拥有 40 亿参数，基于 30 亿参数的 VLM 骨干网络构建。采用"梯度桥接协同训...

1个月前

022.3K

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck 是清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9Stars 联合研发并开源的 Agent 操作系统。以WorkSpace（工作舱）为核心架构，为每个任务提供独...

1个月前

029K

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer是群核科技开源的3D高斯浏览器，支持在普通设备浏览器中流畅渲染10亿级高斯点的超大3D场景。核心技术采用chunk-based LOD树架构，相比李飞飞团队的Spark 2.0...

1个月前

025.8K

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy 是腾讯云 WeData 数据开发治理平台内置的 AI 智能体工作台，基于 WorkBuddy 同源 Agent 底层能力，采用分层 Agent 协作架构（Harness AI 理念...

1个月前

026.3K

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译是腾讯混元团队基于自研Hy-MT2大模型开发的AI翻译工具，主打全场景适配能力。支持33种语言互译及5种民汉/方言翻译，提供学术论文、法律合同等9种翻译风格预设，可通过微信小程序使用。

1个月前

026K

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B 是面壁智能联合清华大学与 OpenBMB 开源社区发布并开源的新一代端侧文本基座大模型。模型以仅 10 亿（1B）的参数规模，在国际权威榜单 AA-Index（Artifici...

2个月前

028.2K

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 是昆仑万维旗下天工AI推出的高性能Agent模型，同时发布轻量化版本 SkyClaw-v1.0-lite。模型专为真实智能体工作流设计，支持百万token超长上下文，深度优化...

2个月前

026.8K

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布并开源的中国首个完全基于国产算力平台（华为昇腾）实现端到端训练的三值（1.58-bit）大模型系列。系列包含 0.5B、1B...

2个月前

023.8K

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed 是智谱AI发布的旗舰级高速推理API，基于GLM-5.1打造，输出速度达到 400 tokens/s，刷新当前全球大模型厂商API的速度上限。

2个月前

027.7K

LongCat-Video-Avatar 1.5 - 美团开源的音频驱动数字人视频生成模型

LongCat-Video-Avatar 1.5 是美团 LongCat 团队开源的音频驱动数字人视频生成模型，基于 13.6B 参数的 LongCat-Video 基础模型构建，采用 MIT 协议完...

2个月前

027.5K

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 是腾讯混元开源的多语言机器翻译模型家族，专为复杂真实场景设计。包含 1.8B、7B 和 30B-A3B（MoE）三个尺寸，均支持 33种语言之间的互译，具备多语言翻译指令遵循能力。

2个月前

025.6K

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro 是智象未来（HiDream-ai）发布的旗舰级闭源图像大模型，采用新一代原生全模态架构 Unified Transformer（UiT），参数规模超过2000...

2个月前

027.1K

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙（Read Frog）是前字节跳动软件工程师 mengxi-ream 开源的 AI 浏览器扩展插件，定位为"沉浸式语言学习助手"，通过 AI 技术将日常网页阅读转化为语言学习过程，支持在原文旁直...

2个月前

029.4K

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory是腾讯云开源的AI智能体记忆工具，专门解决长任务中Token消耗过快的问题。通过分层记忆架构（L0-L3）自动管理信息，将原始对话、关键结论、场景归纳和用户...

2个月前

028K

Gemini Omni - Google DeepMind 推出的新一代原生多模态生成模型

Gemini Omni - Google DeepMind 推出的新一代原生多模态生成模型

Gemini Omni 是 Google DeepMind 在 Google I/O 大会上推出的新一代原生多模态生成模型，首发版本为 Gemini Omni Flash。作为 Google 首个真正...

2个月前

023.8K

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max是阿里云千问发布的面向智能体（Agent）时代的新一代闭源旗舰大模型，定位为"全能智能体基座"。模型在编程智能体、通用智能体、高难度推理、长周期自主执行等维度实现全面突破

2个月前

025.9K

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate 是阿里巴巴通义千问团队发布的实时语音翻译大模型，基于 Qwen3.5-Omni Thinker-Talker 架构打造。模型支持 60 种语言的音频输入与文...

2个月前

025.9K

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark是谷歌在2026年I/O大会上发布的个人AI智能体，是24/7全天候运行的AI代理，运行在谷歌云专属虚拟机上，无需用户设备（如电脑、手机）保持开启状态，即可持续执行任务。

2个月前

027K

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 是 Cursor 发布的最新一代专有 AI 编码模型，基于月之暗面（Moonshot AI）开源的 Kimi K2.5 检查点构建，通过更大规模的强化学习与合成数据训练，在长...

2个月前

026.9K

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis（中文名“马维斯”）是腾讯推出的操作系统层级的个人AI助手，帮助用户更高效地管理电脑和日常任务。可直接访问操作系统底层，支持文件管理（如搜索、整理、格式转换）、系统设置调整（如关闭广告...

2个月前

031K

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash 是 Google I/O 大会发布的全新 AI 模型，是 Gemini 3.5 家族的首个成员。打破了"Flash 系列牺牲性能换速度"的传统定位，在保持每秒约 28...

2个月前

026.4K

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge 是月之暗面（Moonshot AI）推出的浏览器扩展 + 本地桥接服务，专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...

2个月前

045.3K

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build是xAI发布的早期测试版AI编程智能体工具，主要面向专业软件开发者，是一个运行在终端（CLI）的编程智能体，帮助开发者完成编码、构建应用程序和自动化工作流程等任务，直接对标Anth...

2个月前

029K

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman是开源的个人AI助手项目，由Tiny Humans AI团队开发，解决传统AI助手缺乏长期记忆和上下文理解能力的问题。定位为“个人AI操作系统”或“数字分身”，目标是让AI从被动响应...

2个月前

033.8K

Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架

Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架

Xiaomi OneVL 是小米技术团队发布并全面开源的一步式潜空间语言视觉推理框架，专为自动驾驶场景设计。框架在业内首次将VLA（视觉-语言-动作）模型、世界模型与潜空间推理三大技术路线统一到单一架...

2个月前

027.3K

AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架

AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架

AGenUI 是高德地图联合阿里千问C端应用团队发布的行业首个覆盖 iOS、Android、HarmonyOS 三端的端云一体原生 A2UI 开源框架。基于 Google 开源的 A2UI v0.9 ...

2个月前

026.7K

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI 是美国独立开发者 Hunter Bown（GitHub: Hmbown）用 Rust 语言编写的开源终端 AI 编程智能体，专为 DeepSeek V4 系列模型（Pro/F...

2个月前

038K

InsForge - 专为 AI 编程代理设计的开源后端平台

InsForge - 专为 AI 编程代理设计的开源后端平台

InsForge是专为AI编程代理设计的开源后端平台，由PostgreSQL和PostgREST构建，提供身份验证、存储、边缘函数等全栈服务。通过"语义层"将后端操作封装为AI可理解的标准化指令，支持...

2个月前

030.1K

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam 是 Dzine 推出的 AI 驱动动画创作平台，用 AI Agent 为任何故事制作动画。并非简单的单片段视频生成工具，是一个端到端的一体化动画工作室。

2个月前

035.6K

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 是面壁智能（OpenBMB）联合清华大学发布并开源的端侧多模态大模型。模型总参数量仅 1.3B，是 MiniCPM-V 系列有史以来最小的模型，在多模态综合能力上超越了阿里...

2个月前

032.9K

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠是上海灵感菇智能科技有限公司打造的零门槛AI应用创作平台，由语生科学AI孵化平台推出。用户无需编写任何代码，只需在网页中输入创意想法，系统即可自动生成可实际运行的产品

2个月前

033.4K

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA（Mobile Model Access）是中国移动发布的一站式AI模型服务平台。平台接入超300款业界主流AI模型，包括自研"九天"基座大模型及DeepSeek、通义千问、豆包、Kimi...

2个月前

034.9K

GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型

GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型

GPT-Realtime-2 是 OpenAI 发布商用的旗舰级实时语音模型，也是首款具备 GPT-5 级推理能力的端到端语音代理模型，上下文窗口扩展至 128K，支持图像输入、五级可调推理强度与并行...

2个月前

029.5K

JJT - 360推出的全链路AI演示文稿创作工具

JJT - 360推出的全链路AI演示文稿创作工具

JJT（超级J的AI PPT）是360推出的全链路AI演示文稿创作工具，让用户以极简操作产出设计师级别的PPT。用户只需输入主题或粘贴数据，AI即可自动生成结构完整、视觉专业的演示文稿

2个月前

030.4K

觅游 - 美团推出的 AI 原生共生社区

觅游 - 美团推出的 AI 原生共生社区

觅游（Meyo）是美团基础研发 AI 创新产品团队推出的 AI 原生共生社区，目前已进入公测阶段。产品以"养虾"为核心隐喻，将 AI Agent 升级为拥有身份、MBTI 人格、社交关系与成长属性的...

2个月前

035.2K

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 是字节跳动 Mamoda Team 研发的全球首个 25B 级统一多模态生成模型，模型基于自回归-扩散（AR-Diffusion）框架，采用 Qwen3-VL-8B 理解模块与 D...

2个月前

036.5K

Open CoDesign - 开源桌面端 AI 设计工具，Claude Design 平替

Open CoDesign - 开源桌面端 AI 设计工具，Claude Design 平替

Open CoDesign是 OpenCoworkAI 团队开发的开源桌面端 AI 设计工具，采用 MIT 协议，定位为 Claude Design 的开源替代品，同时覆盖 v0 by Vercel...

2个月前

027.5K

DeepSeek-V4 - 深度求索发布的新一代大语言模型系列

DeepSeek-V4 - 深度求索发布的新一代大语言模型系列

DeepSeek-V4 是深度求索发布的新一代大语言模型系列预览版，已同步开源并开放 API。系列采用 MoE 架构，包含 V4-Pro（1.6T 参数 / 49B 激活）与 V4-Flash（284...

2个月前

026.9K

Ring-2.6-1T - 蚂蚁百灵团队发布的万亿级旗舰思考模型

Ring-2.6-1T - 蚂蚁百灵团队发布的万亿级旗舰思考模型

Ring-2.6-1T是蚂蚁集团百灵团队发布的万亿级旗舰思考模型，总参数1万亿，采用稀疏MoE架构，推理时仅激活约630亿参数，兼顾规模与效率。核心创新支持High与XHigh两档可调节推理强度

2个月前

031.6K

Grok 4.3 - xAI公司推出的最新一代大语言模型

Grok 4.3 - xAI公司推出的最新一代大语言模型

Grok 4.3是xAI公司推出的最新一代大语言模型，属于Grok系列的重要更新版本，支持100万token的上下文窗口，可一次性处理整本书、大型代码库或长文档，思维链推理强制开启，模型在给出答案前会...

2个月前

024.6K

文心大模型 5.1 - 百度发布的新一代基础大模型

文心大模型 5.1 - 百度发布的新一代基础大模型

文心大模型5.1（ERNIE 5.1）是百度发布的新一代基础大模型，采用创新的"多维弹性预训练"（Once-for-All）技术，实现"一次训练，生成多种规模模型"。通过弹性深度、弹性宽度与弹性稀疏度...

2个月前

028.4K

StepAudio 2.5 Realtime - 阶跃星辰发布的新一代实时语音大模型

StepAudio 2.5 Realtime - 阶跃星辰发布的新一代实时语音大模型

StepAudio 2.5 Realtime 是阶跃星辰发布的新一代实时语音大模型，目前已全量上线开放平台。模型主打"活人感"对话体验，通过副语言感知、千万级人设自定义与双商进阶的对话能力，实现从文本...

2个月前

026.6K

Uni-1.1 - Luma AI推出的图像生成模型

Uni-1.1 - Luma AI推出的图像生成模型

Uni-1.1是Luma AI推出的图像生成模型，将文本理解与图像生成整合进同一个 decoder-only、autoregressive 模型中，非像主流方案那样把语言模型和图像模型拼接使用。

2个月前

028.9K

小精龙 - 学而思推出的原生学生端精准学智能体

小精龙 - 学而思推出的原生学生端精准学智能体

小精龙是学而思基于OpenClaw架构打造的原生学生端精准学智能体，以"大脑映射、私有财产、学习伴侣"为核心定位。首次将长期记忆、动态学情诊断、教育专属Skill链与情感陪伴系统整合为统一的学生专属A...

3个月前

027.2K

Veo 3.1 Lite - Google DeepMind发布的低成本AI视频生成模型

Veo 3.1 Lite - Google DeepMind发布的低成本AI视频生成模型

Veo 3.1 Lite是Google DeepMind发布的低成本AI视频生成模型，定位为Veo系列中最实惠的版本，专为大规模视频生成场景设计。模型支持文本和图像生成视频，输出720p和1080p分...

3个月前

021.4K

GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型

GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型

GLM-5V-Turbo是智谱发布首个原生多模态Coding基座模型，专为视觉编程打造。模型从预训练阶段深度融合视觉与文本能力，能直接理解设计稿、网页截图、K线图表等视觉信息并生成可运行代码，实现"所...

3个月前

025.4K

Wan2.7-Image - 阿里通义实验室推出的图像生成与编辑统一模型

Wan2.7-Image - 阿里通义实验室推出的图像生成与编辑统一模型

Wan2.7-Image 是阿里巴巴通义实验室发布的图像生成与编辑统一模型，定位为"全场景视觉创作旗舰"。模型直击AI生图领域"标准脸"审美疲劳和"色彩盲盒"痛点，采用生成与理解统一的底层架构，具备文...

3个月前

024.8K

Lightpanda - 专为 AI 时代设计的开源无头浏览器

Lightpanda - 专为 AI 时代设计的开源无头浏览器

Lightpanda是Lightpanda.io公司开发的开源无头浏览器，专为AI自动化和Web抓取设计。采用Zig语言从零构建，去除了图形渲染等冗余功能，核心优势是速度比Chrome快11倍，内存占...

3个月前

022.2K

Matrix-Game 3.0 - 昆仑万维发布的实时交互式世界模型

Matrix-Game 3.0 - 昆仑万维发布的实时交互式世界模型

Matrix-Game 3.0是昆仑万维发布的实时交互式世界模型，属于AIGC全家桶中的三大核心模型之一。模型通过物理仿真驱动，解决了传统世界模型易失忆、环境不稳定的问题，支持720p、40fps实时...

3个月前

026.1K

Mureka V9 - 昆仑万维旗下天工 AI 推出的 AI 音乐模型

Mureka V9 - 昆仑万维旗下天工 AI 推出的 AI 音乐模型

Mureka V9是昆仑万维旗下天工AI在中关村论坛上发布的AI音乐模型，是Mureka系列的最新迭代版本，通过技术创新重塑数字音乐创作生态。基于Musicot（Music Chain-of-Thou...

3个月前

026.7K

LongCat-Next - 美团龙猫开源的原生多模态大模型

LongCat-Next - 美团龙猫开源的原生多模态大模型

LongCat-Next 是美团龙猫开源的原生多模态大模型，采用"下一个Token预测"（NTP）统一架构，将图像、语音与文本映射为同源离散Token，打破传统"语言为中心"的拼凑式设计。核心创新包括...

3个月前

028.1K

PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型

PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型

PixVerse V6是爱诗科技推出的最新一代AI视频生成模型。在保持秒级生成速度的同时，重点优化了人物真实感、复杂运动表现、物理模拟及声画协同能力，支持最长15秒1080P视频生成。

3个月前

029K

Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型

Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型

Qwen3.5-Omni是阿里通义推出的新一代全模态大模型，支持文本、图片、音频、音视频的原生理解与生成。采用Hybrid-Attention MoE架构，支持256K超长上下文，可处理10小时音频或...

3个月前

026.7K

移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent

移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent

移动云 MobileClaw 是中国移动推出的桌面级AI办公智能体，央企首个深度兼容OpenClaw生态的"自研小龙虾"，主打"本地优先、隐私至上"。采用一键安装开箱即用设计，适配Windows/ma...

3个月前

029.8K

Pascal Editor- 开源 AI 3D 建筑设计与可视化工具，网页端直接使用

Pascal Editor- 开源 AI 3D 建筑设计与可视化工具，网页端直接使用

Pascal Editor 是基于浏览器的3D建筑设计与可视化工具，专为建筑师、设计师和开发者打造，支持在网页端直接进行楼层规划、空间布局和建筑场景探索。采用现代Web技术栈（React Three ...

3个月前

023.3K

SciClaw - 面向科研人员的云端 AI Agent 协同系统

SciClaw - 面向科研人员的云端 AI Agent 协同系统

SciClaw（科研龙虾）是面向科研人员的云端 AI 协同系统，定位为"科研人的深夜搭子"。能深度分析文献、自主执行实验、自动排版生成论文/PPT/海报，记住用户电脑里的所有研究资料，将灵感、执行与...

3个月前

022.7K