最新AI资源

共 3143 篇文章

课程资料最新AI资源 AI知识库 AI新闻

排序

浏览收藏

Claude Opus 5 - Anthropic 推出的新一代大模型

Claude Opus 5 是 Anthropic 推出的新一代旗舰大模型，核心是用旗舰一半的价格获得接近顶尖水平的智能"。模型在维持与前代 Opus 4.8 相同调用成本的同时，实现性能的翻倍跃升...

最新AI资源

3天前

06.4K

Gemini 3.5 Flash-Lite - Google 发布的高吞吐低成本模型

Gemini 3.5 Flash-Lite 是 Google 发布的高吞吐低成本模型，官方定位为 3.5 系列中最快、最具成本效益的型号，面向 agentic search、文档处理与大规模生产流量...

最新AI资源

5天前

09.4K

Gemini 3.6 Flash - Google 发布的新一代主力模型

Gemini 3.6 Flash 是 Google 发布的新一代主力模型（Workhorse Model），是 Gemini 3.5 Flash 的升级版，主要面向生产级 AI 智能体（Agent）和...

最新AI资源

5天前

07.7K

TDream - 腾讯推出的 AI 内容创作平台

TDream是腾讯内测的AI内容创作平台，以"互动影游化创作"为核心定位，试图重构用户从内容生产到交互体验的全链路。区别于市面上仅输出单一线性视频的传统文生视频工具，TDream依托五大AI引擎，支持...

最新AI资源

5天前

07.8K

FLUX 3 - Black Forest Labs 发布的首款多模态基础模型

FLUX 3 是德国 AI 公司 Black Forest Labs 发布的首款多模态基础模型，基于自研 Self-Flow 架构，在单一网络中统一训练图像、视频、音频与动作预测，实现真正的"全能模型...

最新AI资源

5天前

08.7K

Qwen-Audio-3.0-TTS - 阿里通义发布的旗舰级语音合成大模型

Qwen-Audio-3.0-TTS是阿里巴巴通义千问团队发布的旗舰级语音合成大模型，提供面向实时交互的Flash版（首包延时约300ms）与面向高质量生成的Plus版，Plus版登顶全球权威榜单Ar...

最新AI资源

5天前

08.9K

Qwen-Image-3.0 - 阿里千问发布的第三代图像生成基础模型

Qwen-Image-3.0 是阿里千问发布的第三代图像生成基础模型，核心主线为"实"，内容丰实、细节真实、知识厚实。模型支持最大 4.5k token 超长文本输入，较前代提升 4.5 倍，可一次性...

最新AI资源

6天前

09.2K

Qwen3.8-Max-Preview - 阿里通义千问发布的新一代旗舰大模型

Qwen3.8-Max-Preview是阿里巴巴通义千问团队发布的新一代旗舰大模型预览版。模型总参数达2.4万亿，采用稀疏MoE架构，是通义千问系列首个突破万亿参数的多模态模型，支持文本、图片、视频...

最新AI资源

6天前

011.7K

Hyra - 腾讯混元团队发布的科研智能体

Hyra（Hunyuan Research Agent）是腾讯混元团队发布的科研智能体，首个版本为Hyra-1.0，支持递归自我改进（RSI），专为性能导向的研究与工程任务打造。采用轻量通用框架，通...

最新AI资源

1周前

016.1K

Wan-Streamer v0.2 - 阿里通义实验室发布的端到端全模态实时交互模型

Wan-Streamer v0.2 是阿里通义实验室发布的端到端全模态实时交互模型，首次将「听、看、说、演」统一进单个因果 Transformer 架构，实现类人般的实时双工交互。

最新AI资源

1周前

012K

Kimi K3 - 月之暗面发布的全球首个开源 3 万亿级大模型

Kimi K3 是月之暗面（Moonshot AI）发布的全球首个开源 3 万亿级大模型，总参数达 2.8 万亿。采用 KDA 混合线性注意力机制与 Stable LatentMoE 稀疏架构，896...

最新AI资源

2周前

020.7K

Wan-Dancer - 阿里通义实验室开源的音乐舞蹈视频生成大模型

Wan-Dancer 是阿里巴巴通义实验室万相（Wan）团队推出的音乐驱动舞蹈视频生成大模型，开源版本 Wan-Dancer-14B 拥有140亿参数，采用 Apache 2.0 协议免费商用。用户只...

最新AI资源

2周前

015.9K

HyOCR-1.5 - 腾讯混元团队开源的轻量化端到端OCR专家大模型

HyOCR-1.5是腾讯混元团队开源的轻量化端到端OCR专家大模型，参数量仅1B，是领域首个训练、推理、权重完整开源的专家模型。采用端到端架构，输入图片即可直接输出Markdown正文、HTML表格...

最新AI资源

2周前

013.7K

Hy3 - 腾讯开源的旗舰级大语言模型，快慢思考融合

Hy3 是腾讯推出的旗舰级开源大语言模型，采用 MoE 架构，拥有 295B 总参数与 21B 激活参数，支持长达 256K 的上下文窗口。核心亮点在于快慢思考融合（Hybrid Reasoning...

最新AI资源

3周前

032.1K

GPT-Live - OpenAI 推出的新一代语音模型，全双工实时对话

GPT-Live 是 OpenAI 推出的新一代语音模型，全面升级 ChatGPT 的语音交互体验。基于全双工（full-duplex）架构构建，能同时倾听和说话，彻底打破了传统 AI 语音助手"你说...

最新AI资源

3周前

018.6K

Grok 4.5 - SpaceXAI 发布的旗舰大语言模型，编码与智能代理专用模型

Grok 4.5 是 SpaceXAI（原 xAI）发布的旗舰大语言模型，定位为"Opus 级别"的编码与智能代理专用模型。模型基于 1.5 万亿参数的 V9 架构打造，采用 MoE（混合专家）架构...

最新AI资源

3周前

019.8K

Seedream 5.0 Pro - 字节跳动发布的多模态图像创作模型

Seedream 5.0 Pro是字节跳动豆包大模型团队发布的多模态图像创作模型，定位为面向专业创作者和企业级用户的设计工具。相比前代，在图文匹配、结构合理性等基础能力上全面提升

最新AI资源

3周前

021.4K

JellyToken - 阿里元境推出的大模型 API 聚合与分发平台

JellyToken 是国内领先的大模型 API 聚合与分发平台，定位为"国内主流 AI 大模型一站式超市"。用户仅需一个 API Key 即可无缝调用通义千问、DeepSeek、智谱、月之暗面、豆包...

最新AI资源

3周前

017.4K

Muse Image - Meta 推出的首个自研 AI 图像生成模型

Muse Image 是 Meta 推出的首个自研 AI 图像生成模型，由 Meta Superintelligence Labs 开发。采用独特的智能体（Agentic）架构，在生成图像前会先与 M...

最新AI资源

3周前

014.5K

Nano Banana 2 Lite - Google发布的轻量版 AI 图像生成模型

Nano Banana 2 Lite（gemini-3.1-flash-lite-image）是Google发布的AI图像生成模型，定位为Nano Banana家族中速度最快、成本最低的轻量版。可在约...

最新AI资源

3周前

015.9K

SeedMusic 1.0 - 字节跳动推出的第一代AI音乐生成模型

SeedMusic 1.0是字节跳动推出的第一代AI音乐生成模型，专注于将用户的文字创意快速转化为带有人声的完整歌曲草稿。用户只需输入一段描述、歌词或风格方向，可在几分钟内生成包含主歌、副歌、编曲和人...

最新AI资源

4周前

027.3K

跃迁维度 - AI 模型聚合服务平台，一个API统一调多款模型

跃迁维度（dimleap）是AI模型聚合服务平台，为全球开发者提供高效能、低成本的多品类AI模型API服务。平台目前已接入DeepSeek、GLM（智谱清言）、MiniMax、kimi、qwen（通...

最新AI资源

4周前

020K

ChatExcel Ultra - ChatExcel团队推出的企业级AI数据智能体

ChatExcel Ultra 是ChatExcel团队面向企业用户和专业数据办公场景推出的全新桌面版，定位为国内首款企业级AI数据智能体。

最新AI资源

4周前

021.1K

Claude Sonnet 5 - Anthropic 发布的最具 Agent 能力模型

Claude Sonnet 5是Anthropic 发布的最具 Agent 能力的 Sonnet 模型，以中端价格提供接近旗舰 Opus 4.8 的自主智能体能力。模型支持 100 万 token 上...

最新AI资源

4周前

017.1K

Astryx - Meta 开源的 React 设计系统

Astryx 是 Meta 以 MIT 协议开源的 React 设计系统，历经八年内部打磨，长期支撑 Facebook、Instagram、WhatsApp 和 Threads 等超过 13,000 ...

最新AI资源

4周前

017.5K

Claude Tag - Anthropic 推出的 Slack 原生 AI 协作功能

Claude Tag 是 Anthropic 推出的 Slack 原生 AI 协作功能，将 Claude 从个人聊天工具升级为团队常驻成员。用户只需在 Slack 频道中输入 @Claude 即可分配...

最新AI资源

1个月前

025.9K

Unlimited-OCR - 百度开源的端到端长文档 OCR 模型

Unlimited-OCR 是百度开源的端到端长文档 OCR 模型，采用 3B 参数 MoE 架构（每 token 仅激活约 500M 参数），核心创新在于将标准注意力替换为 R-SWA（参考滑动窗口...

最新AI资源

1个月前

023.3K

Seedance 2.5 - 字节跳动发布的最新一代 AI 视频生成模型

Seedance 2.5 是字节跳动发布的最新一代 AI 视频生成模型，目前已开启全球企业内测，预计 7 月初正式上线。在 2.0 版本基础上实现了多项关键突破，原生单段视频时长从 15 秒提升至 3...

最新AI资源

1个月前

024.8K

豆包2.1 - 字节跳动发布的最新旗舰大模型系列

豆包2.1（Doubao-Seed-2.1）是字节跳动发布的最新旗舰大模型系列，包含Pro和Turbo两个版本，专为Coding与Agent时代打造。编程能力上，在Terminal Bench 2.1...

最新AI资源

1个月前

022.9K

SkillOpt - 微软研究院开源的 Agent 技能自进化框架

SkillOpt 是微软研究院开源的 Agent 技能自进化框架，核心创新在于将自然语言编写的技能文档视为可训练的外部参数，无需修改底层大模型权重。系统通过"执行-反思-编辑-验证"闭环运作：冻结的目...

最新AI资源

1个月前

022.9K

Qwen-AgentWorld - 阿里通义实验室发布的首个原生语言世界模型

Qwen-AgentWorld 是阿里巴巴通义实验室发布的首个原生语言世界模型（Language World Model, LWM）。与传统"提示进、动作出"的反应式智能体不同，核心逻辑是先预测环境会...

最新AI资源

1个月前

023.7K

Xiaomi MiMo Claw - 小米推出的云端轻量化 AI 智能体平台

Xiaomi MiMo Claw 是小米推出的云端轻量化 AI 智能体平台，基于 OpenClaw 框架打造，搭载自研 MiMo-V2.5-Pro 旗舰模型。主打"一键部署、零门槛"的 AI 办公体验...

最新AI资源

1个月前

028.9K

HiPilot - 小盒科技推出的 AI 原生经营操作系统

HiPilot 是小盒科技推出的 AI 原生经营操作系统，非传统意义上的 AI 助手或工具软件，是由 7 位专业 Agent 组成的 7×24 小时 AI 经营班子，能自主感知企业数据、分析经营态势...

最新AI资源

1个月前

026.3K

LOGOS - 阿里联合中国人大推出的多领域科学生成基础模型

LOGOS（Language Of Generative Objects in Science）是阿里集团联合中国人民大学高瓴人工智能学院开发的首个基于统一"科学语法"的多领域科学生成基础模型。

最新AI资源

1个月前

023.2K

Meshy 3D Agent - Meshy 发布的全球首个 3D 创作 AI Agent

Meshy 3D Agent 是 AI 3D 公司 Meshy 发布的全球首个 3D 创作 AI Agent，通过对话式交互将 3D 创作从一次性生成推向可控、可复用的生产流程。与传统「输入提示词、输...

最新AI资源

1个月前

026.3K

Seedance 2.0 Mini - 字节跳动 Seedance 视频模型系列的轻量版本

Seedance 2.0 Mini 是字节跳动 Seedance 视频模型系列的最新轻量版本，在火山方舟体验中心及 Dreamina 平台上线，计划近期开放 API 服务。

最新AI资源

1个月前

022K

GLM-5.2 - 智谱最新推出的旗舰级开源大模型

GLM-5.2 是智谱最新推出的旗舰级开源大模型，超长上下文理解和智能编程为核心卖点。模型具备百万级 token 的上下文处理能力，能一次性分析整个代码仓库或长篇技术文档。

最新AI资源

2个月前

031.3K

Gemini 3.5 Live Translate - Google 发布的最新实时语音翻译模型

Gemini 3.5 Live Translate 是 Google 发布的最新实时语音翻译模型，支持 70 余种语言和 2,000 多组语言对，覆盖全球绝大多数语种。采用流式实时翻译技术，输出仅落后...

最新AI资源

2个月前

026.1K

DiffusionGemma - Google DeepMind 发布的实验性开源文本生成模型

DiffusionGemma 是 Google DeepMind 发布的实验性开源文本生成模型，采用离散文本扩散架构替代传统自回归方式。基于 Gemma 4 的 MoE 骨干（26B 总参数，激活 3...

最新AI资源

2个月前

025.4K

HiDream-O1-Image-1.5 - 智象未来推出的商用版图像生成大模型

HiDream-O1-Image-1.5 是智象未来（HiDream.ai）推出的商用版图像生成大模型，在全球独立评测平台 Artificial Analysis 的文生图榜单（Text to Ima...

最新AI资源

2个月前

024.5K

html-video - Open Design团队开源的本地视频生成工具

html-video是Open Design团队开源的本地视频生成工具，能将HTML、CSS和数据直接转换为MP4视频。支持21种预设模板，涵盖产品宣传、知识讲解等场景，可配合Claude Code...

最新AI资源

2个月前

026.3K

Kimi K2.7 Code - 月之暗面Kimi开源的编程专用大模型

Kimi K2.7 Code是月之暗面（Moonshot AI）发布并开源的编程专用大模型，属于Kimi K2系列的最新迭代版本。专为长上下文编程和复杂任务优化，聚焦代码生成、理解、调试及多文件项目架...

最新AI资源

2个月前

034.1K

Octask - 光魔科技推出的新一代 AI 原生内容工作室平台

Octask 是深圳光魔科技推出的新一代 AI 原生内容工作室平台，由谷歌与腾讯背景团队打造，获得百度 A 轮投资。核心创新在于将 AI 工具"员工化"，通过像素风格的沉浸式虚拟工作室，让创作者以"老...

最新AI资源

2个月前

024.8K

蛙蛙写作2.0升级深度解析：三栏架构如何重塑AI长篇创作体验

2025年7月，蛙蛙写作正式发布2.0版本，这是该产品自2024年上线以来幅度最大的一次产品重构。此次升级不仅在底层技术能力上实现了对主流大模型的深度整合，更在产品交互架构上做出了突破性的创新——引入...

最新AI资源

2个月前

026.8K

JoyAI-Echo - 京东开源的分钟级长音视频生成框架

JoyAI-Echo 是京东开源的分钟级长音视频生成框架，专为解决AI视频"角色易崩、声音乱变、生成缓慢"三大痛点而设计。基于LTX-2.3 DiT架构，通过跨模态记忆库在长达5分钟的多镜头视频中保持...

最新AI资源

2个月前

027.8K

Meoo CLI - 阿里云Meoo秒悟团队推出的开源命令行工具

Meoo CLI是阿里云Meoo秒悟团队推出的开源命令行工具，是本地AI编程助手与云端能力之间的连接入口，让开发者无需手动处理复杂的云服务配置，即可实现项目的快速部署和上线。

最新AI资源

2个月前

028.2K

Claude Fable 5 - Anthropic发布的第五代大型语言模型

Claude Fable 5是Anthropic发布的第五代大型语言模型，属于其Claude系列，是首个面向公众开放的“Mythos级”（神话级）模型。

最新AI资源

2个月前

026.7K

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B是谷歌开源的多模态AI模型，采用无编码器架构，仅需16GB显存即可在消费级设备运行。取消传统视觉和音频编码器，通过轻量级嵌入模块直接处理原始数据，实现9GB显存占用下接近26B参...

最新AI资源

2个月前

042.6K

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work 是月之暗面（Moonshot AI）公测的桌面端产品，为面向知识工作者的通用型本地 Agent。将 Kimi Code 在工程场景中验证过的本地 Agent 能力，迁移到普通知识工...

最新AI资源

2个月前

047.2K

MAI-Code-1-Flash - 微软自研的 AI 编程模型

MAI-Code-1-Flash 是微软自研的AI编程模型，采用137B参数MoE架构，专为真实开发环境训练，直接使用GitHub Copilot的生产工具链学习多文件编辑、终端调用等实际工作流。

最新AI资源

2个月前

032.8K

MAI-Thinking-1 - 微软AI发布的首款自研高级推理模型

MAI-Thinking-1 是微软AI发布的首款自研高级推理模型。模型采用35B活跃参数、约1T总参数的稀疏混合专家（MoE）架构，拥有256K超长上下文窗口。完全基于干净且拥有商业许可的企业级数据...

最新AI资源

2个月前

030.8K

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 是 NVIDIA 开源的首个完全开放的物理 AI 全模态模型，采用创新的 Mixture-of-Transformers（MoT）架构，将视觉推理、物理世界生成与动作预测统一在单一系...

最新AI资源

2个月前

033.9K

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini是字节跳动开源的视频生成与编辑统一框架，采用"先理解，再生成"的协同架构：MLLM Planner深度解析文本指令与视觉输入，DiT Renderer将其转化为高质量连续视频。

最新AI资源

2个月前

033.9K

语构 - 阿里达摩院推出的 AI 原生应用搭建平台

语构是阿里达摩院推出的 AI 原生应用搭建平台，平台以"Create For What You Want"为理念，让用户无需编写代码即可快速创建各类应用。语构内置 AI 能力，支持通过自然语言描述需求...

最新AI资源

2个月前

030.7K

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus 是阿里巴巴通义千问团队推出的多模态智能体基座模型，在 Qwen3.7 强大文本能力基础上全面升级视觉-语言理解能力，同时完整保留编码、工具调用与生产力工作流等智能体特性。

最新AI资源

2个月前

033K

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3是稀宇科技发布的新一代人工智能大模型，采用自研稀疏注意力机制（MSA），支持100万tokens超长上下文和原生多模态功能（图像/视频输入及桌面操作）。编程能力在SWE-Bench...

最新AI资源

2个月前

036.9K

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA 是阿里通义实验室发布的统一视觉-语言-动作（VLA）具身基础模型。以 Qwen3.5-4B 为视觉语言主干，搭配 1.15B 参数的 DiT（Diffusion Transforme...

最新AI资源

2个月前

033.2K

Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

Step 3.7 Flash是阶跃星辰（StepFun）开源的新一代AI模型，专为生产级智能代理（Agent）设计。在速度、成本与复杂任务处理能力间取得平衡，支持编程、搜索和多模态工作流，并针对本地部...

最新AI资源

2个月前

029.8K

阿里云百炼CLI - 阿里云 Model Studio 开源的命令行工具

阿里云百炼CLI（Bailian CLI）是阿里云Model Studio官方开源的命令行工具，通过一行命令即可让任意AI Agent自动调用阿里云百炼平台的150+款模型和10+款应用能力，涵盖文本...

最新AI资源

2个月前

029.1K

Hy-Memory - 腾讯混元推出的记忆插件，为长期协作型 Agent 设计

Hy-Memory是腾讯混元推出的记忆插件，专为 Openclaw 等长期协作型 Agent 设计。通过 6层记忆框架 × System1/System2 双系统 × 演化链三层核心架构，解决 Ag...

最新AI资源

2个月前

030.6K

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 是 Anthropic 推出的最新旗舰 AI 模型，在 Opus 4.7 基础上全面升级了编码、Agentic 推理与知识工作能力，新增动态工作流（Dynamic Wo...

最新AI资源

2个月前

034.8K

ForgeTrain - 面壁智能联合清华大学、OpenBMB开源的大模型预训练框架

ForgeTrain 是面壁智能联合清华大学、OpenBMB 开源社区发布的全球首个完全由 AI 编写、零人类代码介入的生产级大模型预训练框架。框架采用独创的 Forge Engineering（锻造...

最新AI资源

2个月前

032.1K

omp - 开源的终端 AI Coding Agent

omp（oh-my-pi）是开源的终端 AI Coding Agent，由 can1357 基于 Mario Zechner 的 Pi 项目扩展而来。不是简单的聊天式代码助手，是将终端、代码仓库、L...

最新AI资源

2个月前

042.1K

Wall-OSS-0.5 - 自变量机器人开源的视觉-语言-动作大模型

Wall-OSS-0.5 是自变量机器人（X Square Robot）推出的开源视觉-语言-动作（VLA）大模型，拥有 40 亿参数，基于 30 亿参数的 VLM 骨干网络构建。采用"梯度桥接协同训...

最新AI资源

2个月前

029.7K

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck 是清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9Stars 联合研发并开源的 Agent 操作系统。以WorkSpace（工作舱）为核心架构，为每个任务提供独...

最新AI资源

2个月前

039.8K

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer是群核科技开源的3D高斯浏览器，支持在普通设备浏览器中流畅渲染10亿级高斯点的超大3D场景。核心技术采用chunk-based LOD树架构，相比李飞飞团队的Spark 2.0...

最新AI资源

2个月前

034.5K

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy 是腾讯云 WeData 数据开发治理平台内置的 AI 智能体工作台，基于 WorkBuddy 同源 Agent 底层能力，采用分层 Agent 协作架构（Harness AI 理念...

最新AI资源

2个月前

036K

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译是腾讯混元团队基于自研Hy-MT2大模型开发的AI翻译工具，主打全场景适配能力。支持33种语言互译及5种民汉/方言翻译，提供学术论文、法律合同等9种翻译风格预设，可通过微信小程序使用。

最新AI资源

2个月前

037.2K

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B 是面壁智能联合清华大学与 OpenBMB 开源社区发布并开源的新一代端侧文本基座大模型。模型以仅 10 亿（1B）的参数规模，在国际权威榜单 AA-Index（Artifici...

最新AI资源

2个月前

040.5K

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 是昆仑万维旗下天工AI推出的高性能Agent模型，同时发布轻量化版本 SkyClaw-v1.0-lite。模型专为真实智能体工作流设计，支持百万token超长上下文，深度优化...

最新AI资源

2个月前

035.1K

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布并开源的中国首个完全基于国产算力平台（华为昇腾）实现端到端训练的三值（1.58-bit）大模型系列。系列包含 0.5B、1B...

最新AI资源

2个月前

033.4K

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed 是智谱AI发布的旗舰级高速推理API，基于GLM-5.1打造，输出速度达到 400 tokens/s，刷新当前全球大模型厂商API的速度上限。

最新AI资源

2个月前

036.3K

LongCat-Video-Avatar 1.5 - 美团开源的音频驱动数字人视频生成模型

LongCat-Video-Avatar 1.5 是美团 LongCat 团队开源的音频驱动数字人视频生成模型，基于 13.6B 参数的 LongCat-Video 基础模型构建，采用 MIT 协议完...

最新AI资源

2个月前

035.4K

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 是腾讯混元开源的多语言机器翻译模型家族，专为复杂真实场景设计。包含 1.8B、7B 和 30B-A3B（MoE）三个尺寸，均支持 33种语言之间的互译，具备多语言翻译指令遵循能力。

最新AI资源

2个月前

033.7K

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro 是智象未来（HiDream-ai）发布的旗舰级闭源图像大模型，采用新一代原生全模态架构 Unified Transformer（UiT），参数规模超过2000...

最新AI资源

2个月前

035K

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙（Read Frog）是前字节跳动软件工程师 mengxi-ream 开源的 AI 浏览器扩展插件，定位为"沉浸式语言学习助手"，通过 AI 技术将日常网页阅读转化为语言学习过程，支持在原文旁直...

最新AI资源

2个月前

039K

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory是腾讯云开源的AI智能体记忆工具，专门解决长任务中Token消耗过快的问题。通过分层记忆架构（L0-L3）自动管理信息，将原始对话、关键结论、场景归纳和用户...

最新AI资源

2个月前

036.4K

Gemini Omni - Google DeepMind 推出的新一代原生多模态生成模型

Gemini Omni 是 Google DeepMind 在 Google I/O 大会上推出的新一代原生多模态生成模型，首发版本为 Gemini Omni Flash。作为 Google 首个真正...

最新AI资源

2个月前

031.6K

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max是阿里云千问发布的面向智能体（Agent）时代的新一代闭源旗舰大模型，定位为"全能智能体基座"。模型在编程智能体、通用智能体、高难度推理、长周期自主执行等维度实现全面突破

最新AI资源

2个月前

034.2K

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate 是阿里巴巴通义千问团队发布的实时语音翻译大模型，基于 Qwen3.5-Omni Thinker-Talker 架构打造。模型支持 60 种语言的音频输入与文...

最新AI资源

2个月前

033.8K

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark是谷歌在2026年I/O大会上发布的个人AI智能体，是24/7全天候运行的AI代理，运行在谷歌云专属虚拟机上，无需用户设备（如电脑、手机）保持开启状态，即可持续执行任务。

最新AI资源

2个月前

034K

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 是 Cursor 发布的最新一代专有 AI 编码模型，基于月之暗面（Moonshot AI）开源的 Kimi K2.5 检查点构建，通过更大规模的强化学习与合成数据训练，在长...

最新AI资源

2个月前

034.8K

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis（中文名“马维斯”）是腾讯推出的操作系统层级的个人AI助手，帮助用户更高效地管理电脑和日常任务。可直接访问操作系统底层，支持文件管理（如搜索、整理、格式转换）、系统设置调整（如关闭广告...

最新AI资源

2个月前

040.3K

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash 是 Google I/O 大会发布的全新 AI 模型，是 Gemini 3.5 家族的首个成员。打破了"Flash 系列牺牲性能换速度"的传统定位，在保持每秒约 28...

最新AI资源

2个月前

034.6K

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge 是月之暗面（Moonshot AI）推出的浏览器扩展 + 本地桥接服务，专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...

最新AI资源

2个月前

058.8K

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build是xAI发布的早期测试版AI编程智能体工具，主要面向专业软件开发者，是一个运行在终端（CLI）的编程智能体，帮助开发者完成编码、构建应用程序和自动化工作流程等任务，直接对标Anth...

最新AI资源

2个月前

040.7K

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman是开源的个人AI助手项目，由Tiny Humans AI团队开发，解决传统AI助手缺乏长期记忆和上下文理解能力的问题。定位为“个人AI操作系统”或“数字分身”，目标是让AI从被动响应...

最新AI资源

2个月前

042.2K

Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架

Xiaomi OneVL 是小米技术团队发布并全面开源的一步式潜空间语言视觉推理框架，专为自动驾驶场景设计。框架在业内首次将VLA（视觉-语言-动作）模型、世界模型与潜空间推理三大技术路线统一到单一架...

最新AI资源

2个月前

035.4K

AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架

AGenUI 是高德地图联合阿里千问C端应用团队发布的行业首个覆盖 iOS、Android、HarmonyOS 三端的端云一体原生 A2UI 开源框架。基于 Google 开源的 A2UI v0.9 ...

最新AI资源

2个月前

035.7K

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI 是美国独立开发者 Hunter Bown（GitHub: Hmbown）用 Rust 语言编写的开源终端 AI 编程智能体，专为 DeepSeek V4 系列模型（Pro/F...

最新AI资源

3个月前

048.1K

InsForge - 专为 AI 编程代理设计的开源后端平台

InsForge是专为AI编程代理设计的开源后端平台，由PostgreSQL和PostgREST构建，提供身份验证、存储、边缘函数等全栈服务。通过"语义层"将后端操作封装为AI可理解的标准化指令，支持...

最新AI资源

3个月前

038.1K

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam 是 Dzine 推出的 AI 驱动动画创作平台，用 AI Agent 为任何故事制作动画。并非简单的单片段视频生成工具，是一个端到端的一体化动画工作室。

最新AI资源

3个月前

044.1K

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 是面壁智能（OpenBMB）联合清华大学发布并开源的端侧多模态大模型。模型总参数量仅 1.3B，是 MiniCPM-V 系列有史以来最小的模型，在多模态综合能力上超越了阿里...

最新AI资源

3个月前

042.4K

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠是上海灵感菇智能科技有限公司打造的零门槛AI应用创作平台，由语生科学AI孵化平台推出。用户无需编写任何代码，只需在网页中输入创意想法，系统即可自动生成可实际运行的产品

最新AI资源

3个月前

042.1K

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA（Mobile Model Access）是中国移动发布的一站式AI模型服务平台。平台接入超300款业界主流AI模型，包括自研"九天"基座大模型及DeepSeek、通义千问、豆包、Kimi...

最新AI资源

3个月前

046.6K

GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型

GPT-Realtime-2 是 OpenAI 发布商用的旗舰级实时语音模型，也是首款具备 GPT-5 级推理能力的端到端语音代理模型，上下文窗口扩展至 128K，支持图像输入、五级可调推理强度与并行...

最新AI资源

3个月前

037.8K

JJT - 360推出的全链路AI演示文稿创作工具

JJT（超级J的AI PPT）是360推出的全链路AI演示文稿创作工具，让用户以极简操作产出设计师级别的PPT。用户只需输入主题或粘贴数据，AI即可自动生成结构完整、视觉专业的演示文稿

最新AI资源

3个月前

039.1K

觅游 - 美团推出的 AI 原生共生社区

觅游（Meyo）是美团基础研发 AI 创新产品团队推出的 AI 原生共生社区，目前已进入公测阶段。产品以"养虾"为核心隐喻，将 AI Agent 升级为拥有身份、MBTI 人格、社交关系与成长属性的...

最新AI资源

3个月前

046.8K

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 是字节跳动 Mamoda Team 研发的全球首个 25B 级统一多模态生成模型，模型基于自回归-扩散（AR-Diffusion）框架，采用 Qwen3-VL-8B 理解模块与 D...

最新AI资源

3个月前

045.6K

加载更多