新HiPilot - 小盒科技推出的 AI 原生经营操作系统HiPilot 是小盒科技推出的 AI 原生经营操作系统,非传统意义上的 AI 助手或工具软件,是由 7 位专业 Agent 组成的 7×24 小时 AI 经营班子,能自主感知企业数据、分析经营态势...最新AI资源3小时前0322
新LOGOS - 阿里联合中国人大推出的多领域科学生成基础模型LOGOS(Language Of Generative Objects in Science)是阿里集团联合中国人民大学高瓴人工智能学院开发的首个基于统一"科学语法"的多领域科学生成基础模型。最新AI资源3小时前0347
新Meshy 3D Agent - Meshy 发布的全球首个 3D 创作 AI AgentMeshy 3D Agent 是 AI 3D 公司 Meshy 发布的全球首个 3D 创作 AI Agent,通过对话式交互将 3D 创作从一次性生成推向可控、可复用的生产流程。与传统「输入提示词、输...最新AI资源1天前03.7K
新Seedance 2.0 Mini - 字节跳动 Seedance 视频模型系列的轻量版本Seedance 2.0 Mini 是字节跳动 Seedance 视频模型系列的最新轻量版本,在火山方舟体验中心及 Dreamina 平台上线,计划近期开放 API 服务。最新AI资源1天前02.1K
GLM-5.2 - 智谱最新推出的旗舰级开源大模型GLM-5.2 是智谱最新推出的旗舰级开源大模型,超长上下文理解和智能编程为核心卖点。模型具备百万级 token 的上下文处理能力,能一次性分析整个代码仓库或长篇技术文档。最新AI资源5天前010.4K
Gemini 3.5 Live Translate - Google 发布的最新实时语音翻译模型Gemini 3.5 Live Translate 是 Google 发布的最新实时语音翻译模型,支持 70 余种语言和 2,000 多组语言对,覆盖全球绝大多数语种。采用流式实时翻译技术,输出仅落后...最新AI资源6天前09K
DiffusionGemma - Google DeepMind 发布的实验性开源文本生成模型DiffusionGemma 是 Google DeepMind 发布的实验性开源文本生成模型,采用离散文本扩散架构替代传统自回归方式。基于 Gemma 4 的 MoE 骨干(26B 总参数,激活 3...最新AI资源6天前08K
HiDream-O1-Image-1.5 - 智象未来推出的商用版图像生成大模型HiDream-O1-Image-1.5 是智象未来(HiDream.ai)推出的商用版图像生成大模型,在全球独立评测平台 Artificial Analysis 的文生图榜单(Text to Ima...最新AI资源6天前07.8K
html-video - Open Design团队开源的本地视频生成工具html-video是Open Design团队开源的本地视频生成工具,能将HTML、CSS和数据直接转换为MP4视频。支持21种预设模板,涵盖产品宣传、知识讲解等场景,可配合Claude Code...最新AI资源1周前09.8K
Kimi K2.7 Code - 月之暗面Kimi开源的编程专用大模型Kimi K2.7 Code是月之暗面(Moonshot AI)发布并开源的编程专用大模型,属于Kimi K2系列的最新迭代版本。专为长上下文编程和复杂任务优化,聚焦代码生成、理解、调试及多文件项目架...最新AI资源1周前010.4K
Octask - 光魔科技推出的新一代 AI 原生内容工作室平台Octask 是深圳光魔科技推出的新一代 AI 原生内容工作室平台,由谷歌与腾讯背景团队打造,获得百度 A 轮投资。核心创新在于将 AI 工具"员工化",通过像素风格的沉浸式虚拟工作室,让创作者以"老...最新AI资源1周前09.5K
蛙蛙写作2.0升级深度解析:三栏架构如何重塑AI长篇创作体验2025年7月,蛙蛙写作正式发布2.0版本,这是该产品自2024年上线以来幅度最大的一次产品重构。此次升级不仅在底层技术能力上实现了对主流大模型的深度整合,更在产品交互架构上做出了突破性的创新——引入...最新AI资源1周前011.1K
JoyAI-Echo - 京东开源的分钟级长音视频生成框架JoyAI-Echo 是京东开源的分钟级长音视频生成框架,专为解决AI视频"角色易崩、声音乱变、生成缓慢"三大痛点而设计。基于LTX-2.3 DiT架构,通过跨模态记忆库在长达5分钟的多镜头视频中保持...最新AI资源1周前011.2K
Meoo CLI - 阿里云Meoo秒悟团队推出的开源命令行工具Meoo CLI是阿里云Meoo秒悟团队推出的开源命令行工具,是本地AI编程助手与云端能力之间的连接入口,让开发者无需手动处理复杂的云服务配置,即可实现项目的快速部署和上线。最新AI资源1周前011.9K
Claude Fable 5 - Anthropic发布的第五代大型语言模型Claude Fable 5是Anthropic发布的第五代大型语言模型,属于其Claude系列,是首个面向公众开放的“Mythos级”(神话级)模型。最新AI资源1周前09.9K
Gemma 4 12B - 谷歌开源的多模态 AI 模型Gemma 4 12B是谷歌开源的多模态AI模型,采用无编码器架构,仅需16GB显存即可在消费级设备运行。取消传统视觉和音频编码器,通过轻量级嵌入模块直接处理原始数据,实现9GB显存占用下接近26B参...最新AI资源2周前021.9K
Kimi Work - 月之暗面 Kimi 推出的桌面端产品Kimi Work 是月之暗面(Moonshot AI)公测的桌面端产品,为面向知识工作者的通用型本地 Agent。将 Kimi Code 在工程场景中验证过的本地 Agent 能力,迁移到普通知识工...最新AI资源2周前019.6K
MAI-Code-1-Flash - 微软自研的 AI 编程模型MAI-Code-1-Flash 是微软自研的AI编程模型,采用137B参数MoE架构,专为真实开发环境训练,直接使用GitHub Copilot的生产工具链学习多文件编辑、终端调用等实际工作流。最新AI资源2周前016.3K
MAI-Thinking-1 - 微软AI发布的首款自研高级推理模型MAI-Thinking-1 是微软AI发布的首款自研高级推理模型。模型采用35B活跃参数、约1T总参数的稀疏混合专家(MoE)架构,拥有256K超长上下文窗口。完全基于干净且拥有商业许可的企业级数据...最新AI资源2周前016.5K
Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型Cosmos 3 是 NVIDIA 开源的首个完全开放的物理 AI 全模态模型,采用创新的 Mixture-of-Transformers(MoT)架构,将视觉推理、物理世界生成与动作预测统一在单一系...最新AI资源2周前018.8K
Bernini - 字节跳动开源的视频生成与编辑统一框架Bernini是字节跳动开源的视频生成与编辑统一框架,采用"先理解,再生成"的协同架构:MLLM Planner深度解析文本指令与视觉输入,DiT Renderer将其转化为高质量连续视频。最新AI资源2周前018K
语构 - 阿里达摩院推出的 AI 原生应用搭建平台语构是阿里达摩院推出的 AI 原生应用搭建平台,平台以"Create For What You Want"为理念,让用户无需编写代码即可快速创建各类应用。语构内置 AI 能力,支持通过自然语言描述需求...最新AI资源2周前016.8K
Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型Qwen3.7-Plus 是阿里巴巴通义千问团队推出的多模态智能体基座模型,在 Qwen3.7 强大文本能力基础上全面升级视觉-语言理解能力,同时完整保留编码、工具调用与生产力工作流等智能体特性。最新AI资源2周前016.8K
MiniMax M3 - 稀宇科技发布的新一代人工智能大模型MiniMax M3是稀宇科技发布的新一代人工智能大模型,采用自研稀疏注意力机制(MSA),支持100万tokens超长上下文和原生多模态功能(图像/视频输入及桌面操作)。编程能力在SWE-Bench...最新AI资源3周前020.8K
Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型Qwen-VLA 是阿里通义实验室发布的统一视觉-语言-动作(VLA)具身基础模型。以 Qwen3.5-4B 为视觉语言主干,搭配 1.15B 参数的 DiT(Diffusion Transforme...最新AI资源3周前018.7K
Step 3.7 Flash - 阶跃星辰开源的 AI 模型,专为生产级 Agent 设计Step 3.7 Flash是阶跃星辰(StepFun)开源的新一代AI模型,专为生产级智能代理(Agent)设计。在速度、成本与复杂任务处理能力间取得平衡,支持编程、搜索和多模态工作流,并针对本地部...最新AI资源3周前014K
阿里云百炼CLI - 阿里云 Model Studio 开源的命令行工具阿里云百炼CLI(Bailian CLI)是阿里云Model Studio官方开源的命令行工具,通过一行命令即可让任意AI Agent自动调用阿里云百炼平台的150+款模型和10+款应用能力,涵盖文本...最新AI资源3周前013.2K
Hy-Memory - 腾讯混元推出的记忆插件,为长期协作型 Agent 设计Hy-Memory是腾讯混元推出的记忆插件,专为 Openclaw 等长期协作型 Agent 设计。通过 6层记忆框架 × System1/System2 双系统 × 演化链 三层核心架构,解决 Ag...最新AI资源3周前014.4K
Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型Claude Opus 4.8 是 Anthropic 推出的最新旗舰 AI 模型,在 Opus 4.7 基础上全面升级了编码、Agentic 推理与知识工作能力,新增动态工作流(Dynamic Wo...最新AI资源3周前017.9K
ForgeTrain - 面壁智能联合清华大学、OpenBMB开源的大模型预训练框架ForgeTrain 是面壁智能联合清华大学、OpenBMB 开源社区发布的全球首个完全由 AI 编写、零人类代码介入的生产级大模型预训练框架。框架采用独创的 Forge Engineering(锻造...最新AI资源3周前016.3K
omp - 开源的终端 AI Coding Agentomp(oh-my-pi) 是开源的终端 AI Coding Agent,由 can1357 基于 Mario Zechner 的 Pi 项目扩展而来。不是简单的聊天式代码助手,是将终端、代码仓库、L...最新AI资源3周前016.9K
Wall-OSS-0.5 - 自变量机器人开源的视觉-语言-动作大模型Wall-OSS-0.5 是自变量机器人(X Square Robot)推出的开源视觉-语言-动作(VLA)大模型,拥有 40 亿参数,基于 30 亿参数的 VLM 骨干网络构建。采用"梯度桥接协同训...最新AI资源3周前015.1K
PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统PilotDeck 是清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9Stars 联合研发并开源的 Agent 操作系统。以WorkSpace(工作舱)为核心架构,为每个任务提供独...最新AI资源3周前019.9K
Aholo Viewer - 群核科技开源的3D高斯浏览器Aholo Viewer是群核科技开源的3D高斯浏览器,支持在普通设备浏览器中流畅渲染10亿级高斯点的超大3D场景。核心技术采用chunk-based LOD树架构,相比李飞飞团队的Spark 2.0...最新AI资源3周前016.7K
DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台DataBuddy 是腾讯云 WeData 数据开发治理平台内置的 AI 智能体工作台,基于 WorkBuddy 同源 Agent 底层能力,采用分层 Agent 协作架构(Harness AI 理念...最新AI资源3周前017.8K
腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具腾讯Hy翻译是腾讯混元团队基于自研Hy-MT2大模型开发的AI翻译工具,主打全场景适配能力。支持33种语言互译及5种民汉/方言翻译,提供学术论文、法律合同等9种翻译风格预设,可通过微信小程序使用。最新AI资源3周前018.1K
MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型MiniCPM5-1B 是面壁智能联合清华大学与 OpenBMB 开源社区发布并开源的新一代端侧文本基座大模型。模型以仅 10 亿(1B)的参数规模,在国际权威榜单 AA-Index(Artifici...最新AI资源4周前018.6K
SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型SkyClaw-v1.0 是昆仑万维旗下天工AI推出的高性能Agent模型,同时发布轻量化版本 SkyClaw-v1.0-lite。模型专为真实智能体工作流设计,支持百万token超长上下文,深度优化...最新AI资源4周前018.8K
BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布并开源的中国首个完全基于国产算力平台(华为昇腾)实现端到端训练的三值(1.58-bit)大模型系列。系列包含 0.5B、1B...最新AI资源4周前015.7K
GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理APIGLM-5.1-highspeed 是智谱AI发布的旗舰级高速推理API,基于GLM-5.1打造,输出速度达到 400 tokens/s,刷新当前全球大模型厂商API的速度上限。最新AI资源4周前019.7K
LongCat-Video-Avatar 1.5 - 美团开源的音频驱动数字人视频生成模型LongCat-Video-Avatar 1.5 是美团 LongCat 团队开源的音频驱动数字人视频生成模型,基于 13.6B 参数的 LongCat-Video 基础模型构建,采用 MIT 协议完...最新AI资源4周前018.8K
Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族Hy-MT2 是腾讯混元开源的多语言机器翻译模型家族,专为复杂真实场景设计。包含 1.8B、7B 和 30B-A3B(MoE) 三个尺寸,均支持 33种语言 之间的互译,具备多语言翻译指令遵循能力。最新AI资源4周前018.5K
HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型HiDream-O1-Image-Pro 是智象未来(HiDream-ai)发布的旗舰级闭源图像大模型,采用新一代原生全模态架构 Unified Transformer(UiT),参数规模超过2000...最新AI资源4周前019K
陪读蛙 - 开源的 AI 翻译浏览器扩展插件陪读蛙(Read Frog)是前字节跳动软件工程师 mengxi-ream 开源的 AI 浏览器扩展插件,定位为"沉浸式语言学习助手",通过 AI 技术将日常网页阅读转化为语言学习过程,支持在原文旁直...最新AI资源4周前021.5K
TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具TencentDB Agent Memory是腾讯云开源的AI智能体记忆工具,专门解决长任务中Token消耗过快的问题。通过分层记忆架构(L0-L3)自动管理信息,将原始对话、关键结论、场景归纳和用户...最新AI资源4周前019.1K
Gemini Omni - Google DeepMind 推出的新一代原生多模态生成模型Gemini Omni 是 Google DeepMind 在 Google I/O 大会上推出的新一代原生多模态生成模型,首发版本为 Gemini Omni Flash。作为 Google 首个真正...最新AI资源4周前017.2K
Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型Qwen3.7-Max是阿里云千问发布的面向智能体(Agent)时代的新一代闭源旗舰大模型,定位为"全能智能体基座"。模型在编程智能体、通用智能体、高难度推理、长周期自主执行等维度实现全面突破最新AI资源4周前017.4K
Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型Qwen3.5-LiveTranslate 是阿里巴巴通义千问团队发布的实时语音翻译大模型,基于 Qwen3.5-Omni Thinker-Talker 架构打造。模型支持 60 种语言的音频输入与文...最新AI资源4周前018.2K
Gemini Spark - 谷歌推出的个人 AI 智能体Gemini Spark是谷歌在2026年I/O大会上发布的个人AI智能体,是24/7全天候运行的AI代理,运行在谷歌云专属虚拟机上,无需用户设备(如电脑、手机)保持开启状态,即可持续执行任务。最新AI资源1个月前018.8K
Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型Composer 2.5 是 Cursor 发布的最新一代专有 AI 编码模型,基于月之暗面(Moonshot AI)开源的 Kimi K2.5 检查点构建,通过更大规模的强化学习与合成数据训练,在长...最新AI资源1个月前018K
腾讯Marvis - 腾讯推出操作系统层级的个人AI助手腾讯Marvis(中文名“马维斯”)是腾讯推出的操作系统层级的个人AI助手,帮助用户更高效地管理电脑和日常任务。可直接访问操作系统底层,支持文件管理(如搜索、整理、格式转换)、系统设置调整(如关闭广告...最新AI资源1个月前022.2K
Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型Gemini 3.5 Flash 是 Google I/O 大会发布的全新 AI 模型,是 Gemini 3.5 家族的首个成员。打破了"Flash 系列牺牲性能换速度"的传统定位,在保持每秒约 28...最新AI资源1个月前018.2K
Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件Kimi WebBridge 是月之暗面(Moonshot AI)推出的浏览器扩展 + 本地桥接服务,专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...最新AI资源1个月前036K
Grok Build - xAI 发布的早期测试版AI编程智能体工具Grok Build是xAI发布的早期测试版AI编程智能体工具,主要面向专业软件开发者,是一个运行在终端(CLI)的编程智能体,帮助开发者完成编码、构建应用程序和自动化工作流程等任务,直接对标Anth...最新AI资源1个月前020.6K
OpenHuman - 开源桌面个人 AI 助手,能主动理解用户的数字同事OpenHuman是开源的个人AI助手项目,由Tiny Humans AI团队开发,解决传统AI助手缺乏长期记忆和上下文理解能力的问题。定位为“个人AI操作系统”或“数字分身”,目标是让AI从被动响应...最新AI资源1个月前025.1K
Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架Xiaomi OneVL 是小米技术团队发布并全面开源的一步式潜空间语言视觉推理框架,专为自动驾驶场景设计。框架在业内首次将VLA(视觉-语言-动作)模型、世界模型与潜空间推理三大技术路线统一到单一架...最新AI资源1个月前018.5K
AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架AGenUI 是高德地图联合阿里千问C端应用团队发布的行业首个覆盖 iOS、Android、HarmonyOS 三端的端云一体原生 A2UI 开源框架。基于 Google 开源的 A2UI v0.9 ...最新AI资源1个月前018.2K
DeepSeek-TUI - 开源终端 AI 编程智能体,终端原生 TUI 界面DeepSeek-TUI 是美国独立开发者 Hunter Bown(GitHub: Hmbown)用 Rust 语言编写的开源终端 AI 编程智能体,专为 DeepSeek V4 系列模型(Pro/F...最新AI资源1个月前028.8K
InsForge - 专为 AI 编程代理设计的开源后端平台InsForge是专为AI编程代理设计的开源后端平台,由PostgreSQL和PostgREST构建,提供身份验证、存储、边缘函数等全栈服务。通过"语义层"将后端操作封装为AI可理解的标准化指令,支持...最新AI资源1个月前022.3K
Anijam - Dzine 推出的端到端一体化 AI 动画创作平台Anijam 是 Dzine 推出的 AI 驱动动画创作平台,用 AI Agent 为任何故事制作动画。并非简单的单片段视频生成工具,是一个端到端的一体化动画工作室。最新AI资源1个月前028.3K
MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型MiniCPM-V 4.6 是面壁智能(OpenBMB)联合清华大学发布并开源的端侧多模态大模型。模型总参数量仅 1.3B,是 MiniCPM-V 系列有史以来最小的模型,在多模态综合能力上超越了阿里...最新AI资源1个月前024.5K
灵珠 - 零门槛 AI 应用创作平台,精准解析需求灵珠是上海灵感菇智能科技有限公司打造的零门槛AI应用创作平台,由语生科学AI孵化平台推出。用户无需编写任何代码,只需在网页中输入创意想法,系统即可自动生成可实际运行的产品最新AI资源1个月前024.7K
MoMA - 中国移动发布的一站式AI模型服务平台MoMA(Mobile Model Access) 是中国移动发布的一站式AI模型服务平台。平台接入超300款业界主流AI模型,包括自研"九天"基座大模型及DeepSeek、通义千问、豆包、Kimi...最新AI资源1个月前026.2K
GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型GPT-Realtime-2 是 OpenAI 发布商用的旗舰级实时语音模型,也是首款具备 GPT-5 级推理能力的端到端语音代理模型,上下文窗口扩展至 128K,支持图像输入、五级可调推理强度与并行...最新AI资源1个月前022K
JJT - 360推出的全链路AI演示文稿创作工具JJT(超级J的AI PPT)是360推出的全链路AI演示文稿创作工具,让用户以极简操作产出设计师级别的PPT。用户只需输入主题或粘贴数据,AI即可自动生成结构完整、视觉专业的演示文稿最新AI资源1个月前022.7K
觅游 - 美团推出的 AI 原生共生社区觅游(Meyo) 是美团基础研发 AI 创新产品团队推出的 AI 原生共生社区,目前已进入公测阶段。产品以"养虾"为核心隐喻,将 AI Agent 升级为拥有身份、MBTI 人格、社交关系与成长属性的...最新AI资源1个月前025K
Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型Mamoda2.5 是字节跳动 Mamoda Team 研发的全球首个 25B 级统一多模态生成模型,模型基于自回归-扩散(AR-Diffusion)框架,采用 Qwen3-VL-8B 理解模块与 D...最新AI资源1个月前027.7K
Open CoDesign - 开源桌面端 AI 设计工具,Claude Design 平替Open CoDesign是 OpenCoworkAI 团队开发的开源桌面端 AI 设计工具,采用 MIT 协议,定位为 Claude Design 的开源替代品,同时覆盖 v0 by Vercel...最新AI资源1个月前019.5K
DeepSeek-V4 - 深度求索发布的新一代大语言模型系列DeepSeek-V4 是深度求索发布的新一代大语言模型系列预览版,已同步开源并开放 API。系列采用 MoE 架构,包含 V4-Pro(1.6T 参数 / 49B 激活)与 V4-Flash(284...最新AI资源1个月前018.8K
Ring-2.6-1T - 蚂蚁百灵团队发布的万亿级旗舰思考模型Ring-2.6-1T是蚂蚁集团百灵团队发布的万亿级旗舰思考模型,总参数1万亿,采用稀疏MoE架构,推理时仅激活约630亿参数,兼顾规模与效率。核心创新支持High与XHigh两档可调节推理强度最新AI资源1个月前023.6K
Grok 4.3 - xAI公司推出的最新一代大语言模型Grok 4.3是xAI公司推出的最新一代大语言模型,属于Grok系列的重要更新版本,支持100万token的上下文窗口,可一次性处理整本书、大型代码库或长文档,思维链推理强制开启,模型在给出答案前会...最新AI资源1个月前018.5K
文心大模型 5.1 - 百度发布的新一代基础大模型文心大模型5.1(ERNIE 5.1)是百度发布的新一代基础大模型,采用创新的"多维弹性预训练"(Once-for-All)技术,实现"一次训练,生成多种规模模型"。通过弹性深度、弹性宽度与弹性稀疏度...最新AI资源1个月前020.6K
StepAudio 2.5 Realtime - 阶跃星辰发布的新一代实时语音大模型StepAudio 2.5 Realtime 是阶跃星辰发布的新一代实时语音大模型,目前已全量上线开放平台。模型主打"活人感"对话体验,通过副语言感知、千万级人设自定义与双商进阶的对话能力,实现从文本...最新AI资源1个月前019.4K
Uni-1.1 - Luma AI推出的图像生成模型Uni-1.1是Luma AI推出的图像生成模型,将文本理解与图像生成整合进同一个 decoder-only、autoregressive 模型中,非像主流方案那样把语言模型和图像模型拼接使用。最新AI资源1个月前019.8K
小精龙 - 学而思推出的原生学生端精准学智能体小精龙是学而思基于OpenClaw架构打造的原生学生端精准学智能体,以"大脑映射、私有财产、学习伴侣"为核心定位。首次将长期记忆、动态学情诊断、教育专属Skill链与情感陪伴系统整合为统一的学生专属A...最新AI资源3个月前020.1K
Veo 3.1 Lite - Google DeepMind发布的低成本AI视频生成模型Veo 3.1 Lite是Google DeepMind发布的低成本AI视频生成模型,定位为Veo系列中最实惠的版本,专为大规模视频生成场景设计。模型支持文本和图像生成视频,输出720p和1080p分...最新AI资源3个月前015.8K
GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型GLM-5V-Turbo是智谱发布首个原生多模态Coding基座模型,专为视觉编程打造。模型从预训练阶段深度融合视觉与文本能力,能直接理解设计稿、网页截图、K线图表等视觉信息并生成可运行代码,实现"所...最新AI资源3个月前017.5K
Wan2.7-Image - 阿里通义实验室推出的图像生成与编辑统一模型Wan2.7-Image 是阿里巴巴通义实验室发布的图像生成与编辑统一模型,定位为"全场景视觉创作旗舰"。模型直击AI生图领域"标准脸"审美疲劳和"色彩盲盒"痛点,采用生成与理解统一的底层架构,具备文...最新AI资源3个月前018.3K
Lightpanda - 专为 AI 时代设计的开源无头浏览器Lightpanda是Lightpanda.io公司开发的开源无头浏览器,专为AI自动化和Web抓取设计。采用Zig语言从零构建,去除了图形渲染等冗余功能,核心优势是速度比Chrome快11倍,内存占...最新AI资源3个月前015.7K
Matrix-Game 3.0 - 昆仑万维发布的实时交互式世界模型Matrix-Game 3.0是昆仑万维发布的实时交互式世界模型,属于AIGC全家桶中的三大核心模型之一。模型通过物理仿真驱动,解决了传统世界模型易失忆、环境不稳定的问题,支持720p、40fps实时...最新AI资源3个月前019.6K
Mureka V9 - 昆仑万维旗下天工 AI 推出的 AI 音乐模型Mureka V9是昆仑万维旗下天工AI在中关村论坛上发布的AI音乐模型,是Mureka系列的最新迭代版本,通过技术创新重塑数字音乐创作生态。基于Musicot(Music Chain-of-Thou...最新AI资源3个月前019.7K
LongCat-Next - 美团龙猫开源的原生多模态大模型LongCat-Next 是美团龙猫开源的原生多模态大模型,采用"下一个Token预测"(NTP)统一架构,将图像、语音与文本映射为同源离散Token,打破传统"语言为中心"的拼凑式设计。核心创新包括...最新AI资源3个月前021.1K
PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型PixVerse V6是爱诗科技推出的最新一代AI视频生成模型。在保持秒级生成速度的同时,重点优化了人物真实感、复杂运动表现、物理模拟及声画协同能力,支持最长15秒1080P视频生成。最新AI资源3个月前022.1K
Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型Qwen3.5-Omni是阿里通义推出的新一代全模态大模型,支持文本、图片、音频、音视频的原生理解与生成。采用Hybrid-Attention MoE架构,支持256K超长上下文,可处理10小时音频或...最新AI资源3个月前020.2K
移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent移动云 MobileClaw 是中国移动推出的桌面级AI办公智能体,央企首个深度兼容OpenClaw生态的"自研小龙虾",主打"本地优先、隐私至上"。采用一键安装开箱即用设计,适配Windows/ma...最新AI资源3个月前022.6K
Pascal Editor- 开源 AI 3D 建筑设计与可视化工具,网页端直接使用Pascal Editor 是基于浏览器的3D建筑设计与可视化工具,专为建筑师、设计师和开发者打造,支持在网页端直接进行楼层规划、空间布局和建筑场景探索。采用现代Web技术栈(React Three ...最新AI资源3个月前017.5K
SciClaw - 面向科研人员的云端 AI Agent 协同系统SciClaw(科研龙虾) 是面向科研人员的云端 AI 协同系统,定位为"科研人的深夜搭子"。能深度分析文献、自主执行实验、自动排版生成论文/PPT/海报,记住用户电脑里的所有研究资料,将灵感、执行与...最新AI资源3个月前017.3K
Voxtral TTS - Mistral AI推出的开源文本转语音模型Voxtral TTSoxtral TTS是法国AI公司Mistral AI发布的开源文本转语音模型,采用40亿参数轻量化架构,量化后仅需3GB内存即可在智能手机等边缘设备实时运行。模型原生支持英语...最新AI资源3个月前015.2K
商汤输入法AudioClaw - 商汤科技推出的AI语音智能助手商汤输入法AudioClaw是商汤科技基于日日新多模态大模型打造的AI语音智能应用,深度接入OpenClaw底层能力,定位为"会听话的龙虾"智能助手。最新AI资源3个月前019.4K
SenseAudio - 商汤科技推出的一站式 AI 语音开放平台SenseAudio 是商汤科技推出的AI语音开放平台,面向开发者与企业提供一站式语音AI解决方案。平台集成语音识别(ASR)、语音合成(TTS)、音色克隆等核心能力,语音识别覆盖20+语言并支持说话...最新AI资源3个月前018.9K
TurboQuant - Google Research 推出的突破性内存压缩算法TurboQuant 是 Google Research 推出的突破性内存压缩算法,专为解决大语言模型推理中的 KV 缓存瓶颈而设计。最新AI资源3个月前019.2K
Gemini 3.1 Flash Live - Google 推出的旗舰级实时语音模型Gemini 3.1 Flash Live 是 Google 推出的旗舰级实时语音模型,被誉为"迄今最高质量的音频和语音模型"。主打超低延迟的自然对话体验,支持 90+ 种语言的原生多模态交互,能精准...最新AI资源3个月前019.3K
Lyria 3 Pro - 谷歌推出的最先进AI音乐生成模型Lyria 3 Pro是谷歌推出的最先进的AI音乐生成模型。相比前代Lyria 3仅30秒的生成时长,Pro版本可一次性生成长达3分钟的完整音轨,精准控制前奏、主歌、副歌、桥段等歌曲结构。最新AI资源3个月前018.1K
OpenCLI - 开源 AI 命令行工具框架,任何网站变成命令行OpenCLI是开源的命令行工具框架,将网站、Electron应用和本地命令行工具统一转化为可通过命令行操作的接口,将网站(如B站、知乎、Twitter等)和Electron应用(如Cursor、No...最新AI资源3个月前027.4K
TuyaClaw - 涂鸦智能推出的数字与物理世界联动 AI AgentTuyaClaw 是涂鸦智能(Tuya Smart)推出的 AI 助理,基于 OpenClaw 架构搭建,是全球首个同时打通数字世界与物理世界的 AI Agent。与市面上仅能在屏幕内执行任务的"龙虾...最新AI资源3个月前022.7K
TypeNo - 开源 AI 语音输入工具,专为 macOS 设计TypeNo 是 marswaveai 团队开源的中文语音输入工具,专为 macOS 打造。用户只需轻点 Control 键即可录音,松手后语音会在本地实时转为文字并自动填入当前应用。最新AI资源3个月前021.9K
HiDreamClaw - 智象未来推出的多模态原生AI智能体应用HiDreamClaw 是智象未来(HiDream.ai)推出的多模态原生AI智能体应用,定位为图片与视频生成垂直领域的创作助手。目前已接入其海外平台vivago,面向创作者提供7×24小时在线服务。最新AI资源3个月前022.4K
PrismAudio - 阿里通义实验室开源的视频生成音频框架PrismAudio 是阿里通义实验室推出的视频生成音频框架,专注于为视频自动匹配严丝合缝的环境音效。框架创新性地引入"分解式思维链"(CoT)机制,让模型在生成音频前先分析视频内容、声音时序、音质特...最新AI资源3个月前020.5K
MAI-Image-2 - 微软推出的第二代自研图像生成模型MAI-Image-2 是微软推出的第二代自研图像生成模型,模型在权威评测平台 LMArena 中跃升至全球第三位,仅次于谷歌和 OpenAI,标志着微软在图像生成领域实现从"追赶者"到"第一梯队"的...最新AI资源3个月前022.5K