Последние ресурсы по искусственному интеллекту

共 3143 篇文章

Информация о курсе Последние ресурсы по искусственному интеллекту База знаний по искусственному интеллекту Новости ИИ

расставлять по порядку

GLM-4.6V - Серия мультимодальных моделей большого языка с открытым исходным кодом Wisdom Spectrum AI

GLM-4.6V - серия мультимодальных больших языковых моделей с открытым исходным кодом от Smart Spectrum AI. Серия содержит две версии: GLM-4.6V (106B-A12B), базовая версия для облачных и высокопроизводительных кластерных сценариев, с архитектурой Mixed Expert (MoE), общим количеством около 106 миллиардов ссылок, и активацией...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

042.6K

Бесплатный курс по разработке приложений LangChain для LLM от Эрнеста Нг

LangChain for LLM Application Development - это онлайн-курс, представленный DeepLearning.AI, в котором участвуют основатель LangChain Харрисон Чейз и Эндрю Нг.

Последние ресурсы по искусственному интеллекту Информация о курсе

11 месяцев назад

078.8K

Бесплатный курс о том, как работают трансформеры LLM от Enda Wu

Трансформаторные LLM работают по принципу, который описали DeepLearning.AI и Джей Аламмар и Маартен Гроотенд, авторы книги Hands-On Large Language Models...

Последние ресурсы по искусственному интеллекту Информация о курсе

11 месяцев назад

074.5K

Kimi K2-0905 - последняя модель от Dark Side of the Moon!

Kimi K2-0905 - это продвинутая модель искусственного интеллекта от Dark Side of the Moon Technologies Ltd., которая помогает в программировании, эффективно генерирует код и поддерживает создание аккуратного и стандартизированного кода при фронт-енд разработке. Длина контекста модели увеличена до 256K для решения сложных задач.

Последние ресурсы по искусственному интеллекту

11 месяцев назад

094.1K

Nano Banana - модель искусственного интеллекта для редактирования изображений от Google

Nano Banana - это кодовое название Gemini 2.5 Flash Image для Gemini, модели генерации и редактирования изображений с искусственным интеллектом от Google, которая генерирует детализированные, фотореалистичные изображения на основе простых текстовых подсказок для внесения высококачественных изменений в существующие изображения.

Последние ресурсы по искусственному интеллекту

11 месяцев назад

089.3K

Skywork UniPic 2.0 - эффективное мультимодальное моделирование с открытым исходным кодом от KunlunWanwei

Skywork UniPic 2.0 - это эффективная мультимодальная модель с открытым исходным кодом от Quintessence, ориентированная на создание, редактирование и понимание изображений. Модель основана на 2B-параметрической архитектуре SD3.5-Medium и реализуется с помощью предварительного обучения, прогрессивной стратегии двухзадачного усиления и совместного обучения...

Последние ресурсы по искусственному интеллекту

12 месяцев назад

064K

MiniMax Speech 2.5 - модель генерации речи от MiniMax

MiniMax Speech 2.5 - это усовершенствованная модель генерации речи, разработанная командой MiniMax. Это значительное достижение в области синтеза речи, особенно в плане многоязычной выразительности, точности воспроизведения тембра и языкового охвата. Модель поддерживает 40 языков...

Последние ресурсы по искусственному интеллекту

12 месяцев назад

069.3K

GPT-5 - самая сильная языковая модель, представленная OpenAI, единой интеллектуальной системой

GPT-5 - это последняя языковая модель, выпущенная OpenAI с несколькими обновлениями. Это единая интеллектуальная система со встроенным маршрутизатором реального времени, который автоматически переключается между режимами эффективного и глубокого мышления в зависимости от сложности задачи, обеспечивая быструю реакцию и точные ответы.GPT-5 имеет несколько версий, в том числе для пу...

Последние ресурсы по искусственному интеллекту

12 месяцев назад

068K

Qwen-Image - Tongyi Qianqian запускает базовую модель Qwen-Image с открытым исходным кодом

Qwen-Image - это базовая модель генерации изображений с открытым исходным кодом, выпущенная командой Alibaba Tongyi Qianqian. Имея 20 миллиардов параметров, она использует архитектуру мультимодального диффузионного трансформатора (MMDiT), которая включает в себя три модуля: мультимодальное понимание, кодирование высокого разрешения и диффузионное моделирование.Qwen-Image...

Последние ресурсы по искусственному интеллекту

12 месяцев назад

068.2K

RedOne - новейшая социальная мегамодель от Little Red Book

RedOne - это большая языковая модель, адаптированная для социальных сетей, представленная в Little Red Book. Модель обучается с помощью трехступенчатой стратегии обучения, которая включает в себя социальные и культурные знания, усиливает возможности многозадачности и выравнивает человеческие предпочтения. RedOne значительно превосходит базовую модель в выполнении социальных задач, в обнаружении вредного контента и просмотре...

Последние ресурсы по искусственному интеллекту

1 год назад

060.7K

TRAE SOLO - автоматизированный помощник разработчика с искусственным интеллектом от Wordhop TRAE

TRAE SOLO - это автоматизированный помощник разработки, созданный компанией TRAE, помощник программирования с искусственным интеллектом, запущенный ByteDance, чтобы упростить процесс разработки программного обеспечения с помощью технологии искусственного интеллекта. TRAE SOLO понимает потребности пользователя, поддерживает текстовые описания, голосовые команды и загрузку файлов для ввода требований, а также автоматически планирует...

Последние ресурсы по искусственному интеллекту

1 год назад

092.7K

LiveTalking: интерактивная цифровая система "живой человек" с открытым исходным кодом для синхронного аудио- и видеодиалога в реальном времени

Всеобъемлющее введение LiveTalking является открытым исходным кодом в реальном времени интерактивной цифровой системы человека , стремится построить высококачественный цифровой человек живое решение . Проект использует открытый протокол Apache 2.0, интегрированный с рядом передовых технологий, включая ER-NeRF рендеринг, обработку потокового аудио и видео в реальном времени...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Digital Man

2 года назад

0211.3K

Claude Opus 5 - Anthropic 推出的新一代大模型

Claude Opus 5 是 Anthropic 推出的新一代旗舰大模型，核心是用旗舰一半的价格获得接近顶尖水平的智能"。模型在维持与前代 Opus 4.8 相同调用成本的同时，实现性能的翻倍跃升...

Последние ресурсы по искусственному интеллекту

2 дня назад

06.1K

Gemini 3.5 Flash-Lite - Google 发布的高吞吐低成本模型

Gemini 3.5 Flash-Lite 是 Google 发布的高吞吐低成本模型，官方定位为 3.5 系列中最快、最具成本效益的型号，面向 agentic search、文档处理与大规模生产流量...

Последние ресурсы по искусственному интеллекту

5 дней назад

09.1K

Gemini 3.6 Flash - Google 发布的新一代主力模型

Gemini 3.6 Flash 是 Google 发布的新一代主力模型（Workhorse Model），是 Gemini 3.5 Flash 的升级版，主要面向生产级 AI 智能体（Agent）和...

Последние ресурсы по искусственному интеллекту

5 дней назад

07.3K

TDream - 腾讯推出的 AI 内容创作平台

TDream是腾讯内测的AI内容创作平台，以"互动影游化创作"为核心定位，试图重构用户从内容生产到交互体验的全链路。区别于市面上仅输出单一线性视频的传统文生视频工具，TDream依托五大AI引擎，支持...

Последние ресурсы по искусственному интеллекту

5 дней назад

07.7K

FLUX 3 - Black Forest Labs 发布的首款多模态基础模型

FLUX 3 是德国 AI 公司 Black Forest Labs 发布的首款多模态基础模型，基于自研 Self-Flow 架构，在单一网络中统一训练图像、视频、音频与动作预测，实现真正的"全能模型...

Последние ресурсы по искусственному интеллекту

5 дней назад

08.6K

Qwen-Audio-3.0-TTS - 阿里通义发布的旗舰级语音合成大模型

Qwen-Audio-3.0-TTS是阿里巴巴通义千问团队发布的旗舰级语音合成大模型，提供面向实时交互的Flash版（首包延时约300ms）与面向高质量生成的Plus版，Plus版登顶全球权威榜单Ar...

Последние ресурсы по искусственному интеллекту

5 дней назад

08.6K

Qwen-Image-3.0 - 阿里千问发布的第三代图像生成基础模型

Qwen-Image-3.0 是阿里千问发布的第三代图像生成基础模型，核心主线为"实"，内容丰实、细节真实、知识厚实。模型支持最大 4.5k token 超长文本输入，较前代提升 4.5 倍，可一次性...

Последние ресурсы по искусственному интеллекту

6 дней назад

08.9K

Qwen3.8-Max-Preview - 阿里通义千问发布的新一代旗舰大模型

Qwen3.8-Max-Preview是阿里巴巴通义千问团队发布的新一代旗舰大模型预览版。模型总参数达2.4万亿，采用稀疏MoE架构，是通义千问系列首个突破万亿参数的多模态模型，支持文本、图片、视频...

Последние ресурсы по искусственному интеллекту

6 дней назад

011.6K

Hyra - 腾讯混元团队发布的科研智能体

Hyra（Hunyuan Research Agent）是腾讯混元团队发布的科研智能体，首个版本为Hyra-1.0，支持递归自我改进（RSI），专为性能导向的研究与工程任务打造。采用轻量通用框架，通...

Последние ресурсы по искусственному интеллекту

1 неделя назад

015.9K

Wan-Streamer v0.2 - 阿里通义实验室发布的端到端全模态实时交互模型

Wan-Streamer v0.2 是阿里通义实验室发布的端到端全模态实时交互模型，首次将「听、看、说、演」统一进单个因果 Transformer 架构，实现类人般的实时双工交互。

Последние ресурсы по искусственному интеллекту

1 неделя назад

011.8K

Kimi K3 - 月之暗面发布的全球首个开源 3 万亿级大模型

Kimi K3 是月之暗面（Moonshot AI）发布的全球首个开源 3 万亿级大模型，总参数达 2.8 万亿。采用 KDA 混合线性注意力机制与 Stable LatentMoE 稀疏架构，896...

Последние ресурсы по искусственному интеллекту

2 недели назад

020.6K

Wan-Dancer - 阿里通义实验室开源的音乐舞蹈视频生成大模型

Wan-Dancer 是阿里巴巴通义实验室万相（Wan）团队推出的音乐驱动舞蹈视频生成大模型，开源版本 Wan-Dancer-14B 拥有140亿参数，采用 Apache 2.0 协议免费商用。用户只...

Последние ресурсы по искусственному интеллекту

2 недели назад

015.7K

HyOCR-1.5 - 腾讯混元团队开源的轻量化端到端OCR专家大模型

HyOCR-1.5是腾讯混元团队开源的轻量化端到端OCR专家大模型，参数量仅1B，是领域首个训练、推理、权重完整开源的专家模型。采用端到端架构，输入图片即可直接输出Markdown正文、HTML表格...

Последние ресурсы по искусственному интеллекту

2 недели назад

013.6K

Hy3 - 腾讯开源的旗舰级大语言模型，快慢思考融合

Hy3 是腾讯推出的旗舰级开源大语言模型，采用 MoE 架构，拥有 295B 总参数与 21B 激活参数，支持长达 256K 的上下文窗口。核心亮点在于快慢思考融合（Hybrid Reasoning...

Последние ресурсы по искусственному интеллекту

3 недели назад

032K

GPT-Live - OpenAI 推出的新一代语音模型，全双工实时对话

GPT-Live 是 OpenAI 推出的新一代语音模型，全面升级 ChatGPT 的语音交互体验。基于全双工（full-duplex）架构构建，能同时倾听和说话，彻底打破了传统 AI 语音助手"你说...

Последние ресурсы по искусственному интеллекту

3 недели назад

018.5K

Grok 4.5 - SpaceXAI 发布的旗舰大语言模型，编码与智能代理专用模型

Grok 4.5 是 SpaceXAI（原 xAI）发布的旗舰大语言模型，定位为"Opus 级别"的编码与智能代理专用模型。模型基于 1.5 万亿参数的 V9 架构打造，采用 MoE（混合专家）架构...

Последние ресурсы по искусственному интеллекту

3 недели назад

019.8K

Seedream 5.0 Pro - 字节跳动发布的多模态图像创作模型

Seedream 5.0 Pro是字节跳动豆包大模型团队发布的多模态图像创作模型，定位为面向专业创作者和企业级用户的设计工具。相比前代，在图文匹配、结构合理性等基础能力上全面提升

Последние ресурсы по искусственному интеллекту

3 недели назад

021.2K

JellyToken - 阿里元境推出的大模型 API 聚合与分发平台

JellyToken 是国内领先的大模型 API 聚合与分发平台，定位为"国内主流 AI 大模型一站式超市"。用户仅需一个 API Key 即可无缝调用通义千问、DeepSeek、智谱、月之暗面、豆包...

Последние ресурсы по искусственному интеллекту

3 недели назад

017.3K

Muse Image - Meta 推出的首个自研 AI 图像生成模型

Muse Image 是 Meta 推出的首个自研 AI 图像生成模型，由 Meta Superintelligence Labs 开发。采用独特的智能体（Agentic）架构，在生成图像前会先与 M...

Последние ресурсы по искусственному интеллекту

3 недели назад

014.5K

Nano Banana 2 Lite - Google发布的轻量版 AI 图像生成模型

Nano Banana 2 Lite（gemini-3.1-flash-lite-image）是Google发布的AI图像生成模型，定位为Nano Banana家族中速度最快、成本最低的轻量版。可在约...

Последние ресурсы по искусственному интеллекту

3 недели назад

015.8K

SeedMusic 1.0 - 字节跳动推出的第一代AI音乐生成模型

SeedMusic 1.0是字节跳动推出的第一代AI音乐生成模型，专注于将用户的文字创意快速转化为带有人声的完整歌曲草稿。用户只需输入一段描述、歌词或风格方向，可在几分钟内生成包含主歌、副歌、编曲和人...

Последние ресурсы по искусственному интеллекту

4 недели назад

027.3K

跃迁维度 - AI 模型聚合服务平台，一个API统一调多款模型

跃迁维度（dimleap）是AI模型聚合服务平台，为全球开发者提供高效能、低成本的多品类AI模型API服务。平台目前已接入DeepSeek、GLM（智谱清言）、MiniMax、kimi、qwen（通...

Последние ресурсы по искусственному интеллекту

4 недели назад

020K

ChatExcel Ultra - ChatExcel团队推出的企业级AI数据智能体

ChatExcel Ultra 是ChatExcel团队面向企业用户和专业数据办公场景推出的全新桌面版，定位为国内首款企业级AI数据智能体。

Последние ресурсы по искусственному интеллекту

4 недели назад

021K

Claude Sonnet 5 - Anthropic 发布的最具 Agent 能力模型

Claude Sonnet 5是Anthropic 发布的最具 Agent 能力的 Sonnet 模型，以中端价格提供接近旗舰 Opus 4.8 的自主智能体能力。模型支持 100 万 token 上...

Последние ресурсы по искусственному интеллекту

4 недели назад

017K

Astryx - Meta 开源的 React 设计系统

Astryx 是 Meta 以 MIT 协议开源的 React 设计系统，历经八年内部打磨，长期支撑 Facebook、Instagram、WhatsApp 和 Threads 等超过 13,000 ...

Последние ресурсы по искусственному интеллекту

4 недели назад

017.4K

Claude Tag - Anthropic 推出的 Slack 原生 AI 协作功能

Claude Tag 是 Anthropic 推出的 Slack 原生 AI 协作功能，将 Claude 从个人聊天工具升级为团队常驻成员。用户只需在 Slack 频道中输入 @Claude 即可分配...

Последние ресурсы по искусственному интеллекту

1 месяц назад

025.9K

Unlimited-OCR - 百度开源的端到端长文档 OCR 模型

Unlimited-OCR 是百度开源的端到端长文档 OCR 模型，采用 3B 参数 MoE 架构（每 token 仅激活约 500M 参数），核心创新在于将标准注意力替换为 R-SWA（参考滑动窗口...

Последние ресурсы по искусственному интеллекту

1 месяц назад

023.3K

Seedance 2.5 - 字节跳动发布的最新一代 AI 视频生成模型

Seedance 2.5 是字节跳动发布的最新一代 AI 视频生成模型，目前已开启全球企业内测，预计 7 月初正式上线。在 2.0 版本基础上实现了多项关键突破，原生单段视频时长从 15 秒提升至 3...

Последние ресурсы по искусственному интеллекту

1 месяц назад

024.7K

豆包2.1 - 字节跳动发布的最新旗舰大模型系列

豆包2.1（Doubao-Seed-2.1）是字节跳动发布的最新旗舰大模型系列，包含Pro和Turbo两个版本，专为Coding与Agent时代打造。编程能力上，在Terminal Bench 2.1...

Последние ресурсы по искусственному интеллекту

1 месяц назад

022.7K

SkillOpt - 微软研究院开源的 Agent 技能自进化框架

SkillOpt 是微软研究院开源的 Agent 技能自进化框架，核心创新在于将自然语言编写的技能文档视为可训练的外部参数，无需修改底层大模型权重。系统通过"执行-反思-编辑-验证"闭环运作：冻结的目...

Последние ресурсы по искусственному интеллекту

1 месяц назад

022.6K

Qwen-AgentWorld - 阿里通义实验室发布的首个原生语言世界模型

Qwen-AgentWorld 是阿里巴巴通义实验室发布的首个原生语言世界模型（Language World Model, LWM）。与传统"提示进、动作出"的反应式智能体不同，核心逻辑是先预测环境会...

Последние ресурсы по искусственному интеллекту

1 месяц назад

023.6K

Xiaomi MiMo Claw - 小米推出的云端轻量化 AI 智能体平台

Xiaomi MiMo Claw 是小米推出的云端轻量化 AI 智能体平台，基于 OpenClaw 框架打造，搭载自研 MiMo-V2.5-Pro 旗舰模型。主打"一键部署、零门槛"的 AI 办公体验...

Последние ресурсы по искусственному интеллекту

1 месяц назад

028.9K

HiPilot - 小盒科技推出的 AI 原生经营操作系统

HiPilot 是小盒科技推出的 AI 原生经营操作系统，非传统意义上的 AI 助手或工具软件，是由 7 位专业 Agent 组成的 7×24 小时 AI 经营班子，能自主感知企业数据、分析经营态势...

Последние ресурсы по искусственному интеллекту

1 месяц назад

026.3K

LOGOS - 阿里联合中国人大推出的多领域科学生成基础模型

LOGOS（Language Of Generative Objects in Science）是阿里集团联合中国人民大学高瓴人工智能学院开发的首个基于统一"科学语法"的多领域科学生成基础模型。

Последние ресурсы по искусственному интеллекту

1 месяц назад

022.9K

Meshy 3D Agent - Meshy 发布的全球首个 3D 创作 AI Agent

Meshy 3D Agent 是 AI 3D 公司 Meshy 发布的全球首个 3D 创作 AI Agent，通过对话式交互将 3D 创作从一次性生成推向可控、可复用的生产流程。与传统「输入提示词、输...

Последние ресурсы по искусственному интеллекту

1 месяц назад

026.1K

Seedance 2.0 Mini - 字节跳动 Seedance 视频模型系列的轻量版本

Seedance 2.0 Mini 是字节跳动 Seedance 视频模型系列的最新轻量版本，在火山方舟体验中心及 Dreamina 平台上线，计划近期开放 API 服务。

Последние ресурсы по искусственному интеллекту

1 месяц назад

021.9K

GLM-5.2 - 智谱最新推出的旗舰级开源大模型

GLM-5.2 是智谱最新推出的旗舰级开源大模型，超长上下文理解和智能编程为核心卖点。模型具备百万级 token 的上下文处理能力，能一次性分析整个代码仓库或长篇技术文档。

Последние ресурсы по искусственному интеллекту

2 месяца назад

031.2K

Gemini 3.5 Live Translate - Google 发布的最新实时语音翻译模型

Gemini 3.5 Live Translate 是 Google 发布的最新实时语音翻译模型，支持 70 余种语言和 2,000 多组语言对，覆盖全球绝大多数语种。采用流式实时翻译技术，输出仅落后...

Последние ресурсы по искусственному интеллекту

2 месяца назад

025.9K

DiffusionGemma - Google DeepMind 发布的实验性开源文本生成模型

DiffusionGemma 是 Google DeepMind 发布的实验性开源文本生成模型，采用离散文本扩散架构替代传统自回归方式。基于 Gemma 4 的 MoE 骨干（26B 总参数，激活 3...

Последние ресурсы по искусственному интеллекту

2 месяца назад

025.2K

HiDream-O1-Image-1.5 - 智象未来推出的商用版图像生成大模型

HiDream-O1-Image-1.5 是智象未来（HiDream.ai）推出的商用版图像生成大模型，在全球独立评测平台 Artificial Analysis 的文生图榜单（Text to Ima...

Последние ресурсы по искусственному интеллекту

2 месяца назад

024.4K

html-video - Open Design团队开源的本地视频生成工具

html-video是Open Design团队开源的本地视频生成工具，能将HTML、CSS和数据直接转换为MP4视频。支持21种预设模板，涵盖产品宣传、知识讲解等场景，可配合Claude Code...

Последние ресурсы по искусственному интеллекту

2 месяца назад

026.3K

Kimi K2.7 Code - 月之暗面Kimi开源的编程专用大模型

Kimi K2.7 Code是月之暗面（Moonshot AI）发布并开源的编程专用大模型，属于Kimi K2系列的最新迭代版本。专为长上下文编程和复杂任务优化，聚焦代码生成、理解、调试及多文件项目架...

Последние ресурсы по искусственному интеллекту

2 месяца назад

034K

Octask - 光魔科技推出的新一代 AI 原生内容工作室平台

Octask 是深圳光魔科技推出的新一代 AI 原生内容工作室平台，由谷歌与腾讯背景团队打造，获得百度 A 轮投资。核心创新在于将 AI 工具"员工化"，通过像素风格的沉浸式虚拟工作室，让创作者以"老...

Последние ресурсы по искусственному интеллекту

2 месяца назад

024.8K

蛙蛙写作2.0升级深度解析：三栏架构如何重塑AI长篇创作体验

2025年7月，蛙蛙写作正式发布2.0版本，这是该产品自2024年上线以来幅度最大的一次产品重构。此次升级不仅在底层技术能力上实现了对主流大模型的深度整合，更在产品交互架构上做出了突破性的创新——引入...

Последние ресурсы по искусственному интеллекту

2 месяца назад

026.8K

JoyAI-Echo - 京东开源的分钟级长音视频生成框架

JoyAI-Echo 是京东开源的分钟级长音视频生成框架，专为解决AI视频"角色易崩、声音乱变、生成缓慢"三大痛点而设计。基于LTX-2.3 DiT架构，通过跨模态记忆库在长达5分钟的多镜头视频中保持...

Последние ресурсы по искусственному интеллекту

2 месяца назад

027.7K

Meoo CLI - 阿里云Meoo秒悟团队推出的开源命令行工具

Meoo CLI是阿里云Meoo秒悟团队推出的开源命令行工具，是本地AI编程助手与云端能力之间的连接入口，让开发者无需手动处理复杂的云服务配置，即可实现项目的快速部署和上线。

Последние ресурсы по искусственному интеллекту

2 месяца назад

028.1K

Claude Fable 5 - Anthropic发布的第五代大型语言模型

Claude Fable 5是Anthropic发布的第五代大型语言模型，属于其Claude系列，是首个面向公众开放的“Mythos级”（神话级）模型。

Последние ресурсы по искусственному интеллекту

2 месяца назад

026.5K

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B是谷歌开源的多模态AI模型，采用无编码器架构，仅需16GB显存即可在消费级设备运行。取消传统视觉和音频编码器，通过轻量级嵌入模块直接处理原始数据，实现9GB显存占用下接近26B参...

Последние ресурсы по искусственному интеллекту

2 месяца назад

042.6K

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work 是月之暗面（Moonshot AI）公测的桌面端产品，为面向知识工作者的通用型本地 Agent。将 Kimi Code 在工程场景中验证过的本地 Agent 能力，迁移到普通知识工...

Последние ресурсы по искусственному интеллекту

2 месяца назад

047K

MAI-Code-1-Flash - 微软自研的 AI 编程模型

MAI-Code-1-Flash 是微软自研的AI编程模型，采用137B参数MoE架构，专为真实开发环境训练，直接使用GitHub Copilot的生产工具链学习多文件编辑、终端调用等实际工作流。

Последние ресурсы по искусственному интеллекту

2 месяца назад

032.7K

MAI-Thinking-1 - 微软AI发布的首款自研高级推理模型

MAI-Thinking-1 是微软AI发布的首款自研高级推理模型。模型采用35B活跃参数、约1T总参数的稀疏混合专家（MoE）架构，拥有256K超长上下文窗口。完全基于干净且拥有商业许可的企业级数据...

Последние ресурсы по искусственному интеллекту

2 месяца назад

030.8K

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 是 NVIDIA 开源的首个完全开放的物理 AI 全模态模型，采用创新的 Mixture-of-Transformers（MoT）架构，将视觉推理、物理世界生成与动作预测统一在单一系...

Последние ресурсы по искусственному интеллекту

2 месяца назад

033.8K

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini是字节跳动开源的视频生成与编辑统一框架，采用"先理解，再生成"的协同架构：MLLM Planner深度解析文本指令与视觉输入，DiT Renderer将其转化为高质量连续视频。

Последние ресурсы по искусственному интеллекту

2 месяца назад

033.8K

语构 - 阿里达摩院推出的 AI 原生应用搭建平台

语构是阿里达摩院推出的 AI 原生应用搭建平台，平台以"Create For What You Want"为理念，让用户无需编写代码即可快速创建各类应用。语构内置 AI 能力，支持通过自然语言描述需求...

Последние ресурсы по искусственному интеллекту

2 месяца назад

030.6K

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus 是阿里巴巴通义千问团队推出的多模态智能体基座模型，在 Qwen3.7 强大文本能力基础上全面升级视觉-语言理解能力，同时完整保留编码、工具调用与生产力工作流等智能体特性。

Последние ресурсы по искусственному интеллекту

2 месяца назад

033K

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3是稀宇科技发布的新一代人工智能大模型，采用自研稀疏注意力机制（MSA），支持100万tokens超长上下文和原生多模态功能（图像/视频输入及桌面操作）。编程能力在SWE-Bench...

Последние ресурсы по искусственному интеллекту

2 месяца назад

036.8K

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA 是阿里通义实验室发布的统一视觉-语言-动作（VLA）具身基础模型。以 Qwen3.5-4B 为视觉语言主干，搭配 1.15B 参数的 DiT（Diffusion Transforme...

Последние ресурсы по искусственному интеллекту

2 месяца назад

033.1K

Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

Step 3.7 Flash是阶跃星辰（StepFun）开源的新一代AI模型，专为生产级智能代理（Agent）设计。在速度、成本与复杂任务处理能力间取得平衡，支持编程、搜索和多模态工作流，并针对本地部...

Последние ресурсы по искусственному интеллекту

2 месяца назад

029.7K

阿里云百炼CLI - 阿里云 Model Studio 开源的命令行工具

阿里云百炼CLI（Bailian CLI）是阿里云Model Studio官方开源的命令行工具，通过一行命令即可让任意AI Agent自动调用阿里云百炼平台的150+款模型和10+款应用能力，涵盖文本...

Последние ресурсы по искусственному интеллекту

2 месяца назад

029K

Hy-Memory - 腾讯混元推出的记忆插件，为长期协作型 Agent 设计

Hy-Memory是腾讯混元推出的记忆插件，专为 Openclaw 等长期协作型 Agent 设计。通过 6层记忆框架 × System1/System2 双系统 × 演化链三层核心架构，解决 Ag...

Последние ресурсы по искусственному интеллекту

2 месяца назад

030.4K

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 是 Anthropic 推出的最新旗舰 AI 模型，在 Opus 4.7 基础上全面升级了编码、Agentic 推理与知识工作能力，新增动态工作流（Dynamic Wo...

Последние ресурсы по искусственному интеллекту

2 месяца назад

034.7K

ForgeTrain - 面壁智能联合清华大学、OpenBMB开源的大模型预训练框架

ForgeTrain 是面壁智能联合清华大学、OpenBMB 开源社区发布的全球首个完全由 AI 编写、零人类代码介入的生产级大模型预训练框架。框架采用独创的 Forge Engineering（锻造...

Последние ресурсы по искусственному интеллекту

2 месяца назад

032.1K

omp - 开源的终端 AI Coding Agent

omp（oh-my-pi）是开源的终端 AI Coding Agent，由 can1357 基于 Mario Zechner 的 Pi 项目扩展而来。不是简单的聊天式代码助手，是将终端、代码仓库、L...

Последние ресурсы по искусственному интеллекту

2 месяца назад

042K

Wall-OSS-0.5 - 自变量机器人开源的视觉-语言-动作大模型

Wall-OSS-0.5 是自变量机器人（X Square Robot）推出的开源视觉-语言-动作（VLA）大模型，拥有 40 亿参数，基于 30 亿参数的 VLM 骨干网络构建。采用"梯度桥接协同训...

Последние ресурсы по искусственному интеллекту

2 месяца назад

029.6K

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck 是清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9Stars 联合研发并开源的 Agent 操作系统。以WorkSpace（工作舱）为核心架构，为每个任务提供独...

Последние ресурсы по искусственному интеллекту

2 месяца назад

039.7K

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer是群核科技开源的3D高斯浏览器，支持在普通设备浏览器中流畅渲染10亿级高斯点的超大3D场景。核心技术采用chunk-based LOD树架构，相比李飞飞团队的Spark 2.0...

Последние ресурсы по искусственному интеллекту

2 месяца назад

034.4K

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy 是腾讯云 WeData 数据开发治理平台内置的 AI 智能体工作台，基于 WorkBuddy 同源 Agent 底层能力，采用分层 Agent 协作架构（Harness AI 理念...

Последние ресурсы по искусственному интеллекту

2 месяца назад

035.9K

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译是腾讯混元团队基于自研Hy-MT2大模型开发的AI翻译工具，主打全场景适配能力。支持33种语言互译及5种民汉/方言翻译，提供学术论文、法律合同等9种翻译风格预设，可通过微信小程序使用。

Последние ресурсы по искусственному интеллекту

2 месяца назад

037.2K

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B 是面壁智能联合清华大学与 OpenBMB 开源社区发布并开源的新一代端侧文本基座大模型。模型以仅 10 亿（1B）的参数规模，在国际权威榜单 AA-Index（Artifici...

Последние ресурсы по искусственному интеллекту

2 месяца назад

040.3K

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 是昆仑万维旗下天工AI推出的高性能Agent模型，同时发布轻量化版本 SkyClaw-v1.0-lite。模型专为真实智能体工作流设计，支持百万token超长上下文，深度优化...

Последние ресурсы по искусственному интеллекту

2 месяца назад

035.1K

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布并开源的中国首个完全基于国产算力平台（华为昇腾）实现端到端训练的三值（1.58-bit）大模型系列。系列包含 0.5B、1B...

Последние ресурсы по искусственному интеллекту

2 месяца назад

033.3K

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed 是智谱AI发布的旗舰级高速推理API，基于GLM-5.1打造，输出速度达到 400 tokens/s，刷新当前全球大模型厂商API的速度上限。

Последние ресурсы по искусственному интеллекту

2 месяца назад

036.3K

LongCat-Video-Avatar 1.5 - 美团开源的音频驱动数字人视频生成模型

LongCat-Video-Avatar 1.5 是美团 LongCat 团队开源的音频驱动数字人视频生成模型，基于 13.6B 参数的 LongCat-Video 基础模型构建，采用 MIT 协议完...

Последние ресурсы по искусственному интеллекту

2 месяца назад

035.3K

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 是腾讯混元开源的多语言机器翻译模型家族，专为复杂真实场景设计。包含 1.8B、7B 和 30B-A3B（MoE）三个尺寸，均支持 33种语言之间的互译，具备多语言翻译指令遵循能力。

Последние ресурсы по искусственному интеллекту

2 месяца назад

033.6K

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro 是智象未来（HiDream-ai）发布的旗舰级闭源图像大模型，采用新一代原生全模态架构 Unified Transformer（UiT），参数规模超过2000...

Последние ресурсы по искусственному интеллекту

2 месяца назад

034.8K

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙（Read Frog）是前字节跳动软件工程师 mengxi-ream 开源的 AI 浏览器扩展插件，定位为"沉浸式语言学习助手"，通过 AI 技术将日常网页阅读转化为语言学习过程，支持在原文旁直...

Последние ресурсы по искусственному интеллекту

2 месяца назад

038.8K

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory是腾讯云开源的AI智能体记忆工具，专门解决长任务中Token消耗过快的问题。通过分层记忆架构（L0-L3）自动管理信息，将原始对话、关键结论、场景归纳和用户...

Последние ресурсы по искусственному интеллекту

2 месяца назад

036.2K

Gemini Omni - Google DeepMind 推出的新一代原生多模态生成模型

Gemini Omni 是 Google DeepMind 在 Google I/O 大会上推出的新一代原生多模态生成模型，首发版本为 Gemini Omni Flash。作为 Google 首个真正...

Последние ресурсы по искусственному интеллекту

2 месяца назад

031.6K

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max是阿里云千问发布的面向智能体（Agent）时代的新一代闭源旗舰大模型，定位为"全能智能体基座"。模型在编程智能体、通用智能体、高难度推理、长周期自主执行等维度实现全面突破

Последние ресурсы по искусственному интеллекту

2 месяца назад

034.2K

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate 是阿里巴巴通义千问团队发布的实时语音翻译大模型，基于 Qwen3.5-Omni Thinker-Talker 架构打造。模型支持 60 种语言的音频输入与文...

Последние ресурсы по искусственному интеллекту

2 месяца назад

033.8K

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark是谷歌在2026年I/O大会上发布的个人AI智能体，是24/7全天候运行的AI代理，运行在谷歌云专属虚拟机上，无需用户设备（如电脑、手机）保持开启状态，即可持续执行任务。

Последние ресурсы по искусственному интеллекту

2 месяца назад

033.9K

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 是 Cursor 发布的最新一代专有 AI 编码模型，基于月之暗面（Moonshot AI）开源的 Kimi K2.5 检查点构建，通过更大规模的强化学习与合成数据训练，在长...

Последние ресурсы по искусственному интеллекту

2 месяца назад

034.7K

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis（中文名“马维斯”）是腾讯推出的操作系统层级的个人AI助手，帮助用户更高效地管理电脑和日常任务。可直接访问操作系统底层，支持文件管理（如搜索、整理、格式转换）、系统设置调整（如关闭广告...

Последние ресурсы по искусственному интеллекту

2 месяца назад

040.2K

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash 是 Google I/O 大会发布的全新 AI 模型，是 Gemini 3.5 家族的首个成员。打破了"Flash 系列牺牲性能换速度"的传统定位，在保持每秒约 28...

Последние ресурсы по искусственному интеллекту

2 месяца назад

034.5K

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge 是月之暗面（Moonshot AI）推出的浏览器扩展 + 本地桥接服务，专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...

Последние ресурсы по искусственному интеллекту

2 месяца назад

058.6K

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build是xAI发布的早期测试版AI编程智能体工具，主要面向专业软件开发者，是一个运行在终端（CLI）的编程智能体，帮助开发者完成编码、构建应用程序和自动化工作流程等任务，直接对标Anth...

Последние ресурсы по искусственному интеллекту

2 месяца назад

040.4K

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman是开源的个人AI助手项目，由Tiny Humans AI团队开发，解决传统AI助手缺乏长期记忆和上下文理解能力的问题。定位为“个人AI操作系统”或“数字分身”，目标是让AI从被动响应...

Последние ресурсы по искусственному интеллекту

2 месяца назад

042.2K

Загрузка Подробнее