最新AI资源

共 3143 篇文章

课程资料最新AI资源 AI知识库 AI新闻

排序

InternVL3.5 - 上海AI实验室开源的多模态大模型

InternVL3.5 - 上海AI实验室开源的多模态大模型

InternVL3.5（书生·万象3.5）是上海人工智能实验室开源的多模态大模型，模型在通用能力、推理能力和部署效率上全面升级，提供从10亿到2410亿参数的九种尺寸版本，覆盖不同资源需求场景，包含稠...

11个月前

066.9K

Mu - 微软推出的小参数语言模型，支持Windows智能体

Mu - 微软推出的小参数语言模型，支持Windows智能体

Mu是微软推出的小参数语言模型，参数量仅3.3亿，专为在NPU和边缘设备上高效运行设计。模型基于编码器解码器架构，通过硬件感知优化、模型量化及特定任务微调，实现每秒超100 tokens的响应速度。M...

1年前

066.8K

浙大先生 - 浙大推出的AI智能体平台，深度融合DeepSeek

浙大先生 - 浙大推出的AI智能体平台，深度融合DeepSeek

浙大先生是浙江大学推出的深度融合智能体平台，基于DeepSeek V3和R1模型，依托CARSI资源共享平台，为浙江大学师生以及全国829所CARSI联盟高校师生提供免费服务。

1年前

066.8K

Hailuo 02 - MiniMax推出的AI视频生成模型，性能超越可灵和Veo 3

Hailuo 02 - MiniMax推出的AI视频生成模型，性能超越可灵和Veo 3

Hailuo 02 是 MiniMax 公司推出的全新 AI 视频生成模型，是 Hailuo 01 的升级版本。模型在图生视频和文生视频领域表现出色，排名仅次于字节的 Seedance 1.0，超越快...

1年前

066.7K

Clacky AI - AI编程助手，面向开发者的云端开发环境

Clacky AI - AI编程助手，面向开发者的云端开发环境

Clacky AI是面向开发者的云端开发环境（CDE），致力于打造L3级别的AI编程助手。工具支持多种编程语言，包括Python、Node.js、Golang、Ruby和Java等，能帮助开发者快速将...

1年前

066.7K

浙江大学免费PDF资料《大模型基础》 - 附下载链接

浙江大学免费PDF资料《大模型基础》 - 附下载链接

《大模型基础》深入剖析大语言模型（LLMs）的核心技术与实践路径。从语言模型的基础理论入手，系统讲解基于统计、循环神经网络（RNN）和Transformer架构的模型设计原理，重点探讨大语言模型的三大...

最新AI资源课程资料

11个月前

066.7K

Tizzy.ai - 百度推出的AI搜索应用

Tizzy.ai - 百度推出的AI搜索应用

Tizzy.ai 是百度推出的 AI 智能搜索应用。Tizzy.ai 基于百度的大模型技术，具备强大的智能搜索功能，能快速回答问题、深度思考和辅助决策。Tizzy.ai 界面简洁，无广告和弹窗，底部导...

1年前

066.7K

A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI（Agent-to-User Interface）是谷歌开源的Agent驱动型界面协议，解决AI代理生成复杂交互界面的难题。通过一种声明式JSON格式，让AI代理描述用户界面的结构，客户端应用...

7个月前

066.6K

Mobvoi MCP Server - 出门问问开源的多模态MCP服务工具

Mobvoi MCP Server - 出门问问开源的多模态MCP服务工具

Mobvoi MCP Server 是出门问问推出的集成多模态 AI 能力的工具。工具集成语音生成、声音克隆、图片驱动数字人、视频配音和视频翻译等功能，用户输入文本能灵活调用。Mobvoi MCP S...

1年前

066.6K

吴恩达面向开发者的ChatGPT提示工程免费课程

吴恩达面向开发者的ChatGPT提示工程免费课程

面向开发者的ChatGPT提示工程是DeepLearning.AI与OpenAI联合推出的课程，专为开发者设计，由Isa Fulford, 吴恩达Andrew Ng主讲，教授如何用大型语言模型（LLM...

最新AI资源课程资料

11个月前

066.6K

GLM-Experimental - 智谱AI推出的实验性模型

GLM-Experimental - 智谱AI推出的实验性模型

GLM-Experimental 是智谱 AI 推出的实验性大语言模型，已在 Z.ai 平台上线。模型具备自动生成 PPT 的能力，用户输入主题或要点后，模型能快速生成结构清晰、格式规范的演示文稿，将...

1年前

066.5K

Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - 谷歌开源的编程Agent

Gemini CLI 是谷歌开源的 AI 编程工具，基于将 Gemini 大模型融入开发者终端，为开发者提供强大的 AI 功能。工具能理解代码、操作文件、执行命令并动态排查问题，帮助开发者高效地编写代...

1年前

066.5K

Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash 是阿里巴巴通义千问系列推出的高性能、低成本的语言模型，专为快速响应和高效处理简单任务设计。基于先进的 Mixture-of-Experts (MoE) 架构，通过稀疏专家网络实现...

12个月前

066.5K

绘想 - 百度推出的AI视频生成平台

绘想 - 百度推出的AI视频生成平台

绘想是百度推出的 AI 视频生成平台，基于 AI 技术助力用户轻松打造个性化视频。绘想界面直观，工具强大，具备灵感推荐功能，能为创作者提供创意启发，支持一键同款操作，能快速生成相似视频，简化创作流程。

1年前

066.4K

MailMoo：使用AI为每个客户生成个性化视频提升销售转化率

MailMoo：使用AI为每个客户生成个性化视频提升销售转化率

综合介绍 MailMoo 是一家专注于帮助企业和销售团队提升冷邮件效果的创新平台。通过人工智能技术，用户只需录制一段视频，MailMoo就能自动为数千个潜在客户生成个性化的视频内容。这种方式大幅提高了...

最新AI资源 # AI营销

1年前

066.4K

RoboBrain 2.0 - 智谱开源的通用具身大脑模型

RoboBrain 2.0 - 智谱开源的通用具身大脑模型

RoboBrain 2.0 是智谱开源的先进具身大脑模型，为机器人提供强大的感知、推理和规划能力。RoboBrain 2.0包含 7B 和 32B 两个版本，采用异构架构，融合视觉编码器和语言模型，支...

1年前

066.3K

InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS是群核科技推出的高质量3D高斯语义数据集。数据集包含1000个3D场景，涵盖80多种室内环境，如家庭、便利店、婚宴厅和博物馆等。数据集中有755个类别的554,000多个对象实例...

1年前

066.3K

居然设计家 - 居然之家和阿里联合推出的AI家装设计平台

居然设计家 - 居然之家和阿里联合推出的AI家装设计平台

居然设计家（Homestyler）是居然之家和阿里巴巴联合打造的全球顶尖AI家装设计平台。平台基于AI、3D、VR及大数据等技术，为家装设计师和DIY客户提供便捷的在线设计工具，同时为家居商家提供数字...

1年前

066.1K

Stable Diffusion Web:在线体验Stable Diffusion XL

Stable Diffusion Web:在线体验Stable Diffusion XL

综合介绍 Stable Diffusion Web是一个在线的稳定扩散模型平台，用户可以免费使用。这个模型用于将文本转换为逼真的图片，提供简单易用的界面。通过输入文本提示并点击“生成”，用户即可快速获...

最新AI资源 # AI在线生成图像

2年前

066.1K

Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft 是腾讯 Hunyuan 团队开源的交互式游戏视频生成框架。框架能从单张图片和提示生成高动态的游戏视频，支持用户通过键盘和鼠标实时控制视频内容。

12个月前

066.1K

BoomCut - 小影科技推出的 AI 出海营销视频生成工具

BoomCut - 小影科技推出的 AI 出海营销视频生成工具

BoomCut （爆剪辑）是小影科技推出的AI 跨境营销视频本地化工具。工具具备强大的功能，基于先进的唇音驱动和音色克隆技术，快速生成多种语言版本的口播视频，满足不同国家和地区用户的语言需求。

1年前

066.1K

11ai - ElevenLabs推出个人AI语音助理

11ai - ElevenLabs推出个人AI语音助理

11ai是ElevenLabs推出的AI语音助理，以语音交互为核心，通过自然流畅的对话提升用户的工作效率。11ai支持超过 5000 种声音，用户可以自定义专属语音，助理更具个性化。具备低延迟的语音互...

1年前

066.1K

袋鼠参谋 – 美团推出的商家AI智能决策应用

袋鼠参谋 – 美团推出的商家AI智能决策应用

袋鼠参谋是美团推出的面向商家的AI智能决策应用，帮助商家解决开店、运营中的难题。基于美团海量的餐饮数据和10多年线上运营经验，通过对话式交互，为商家提供赛道选择、开店选址、菜品研发、门店运营等场景的精...

1年前

066.1K

FastDeploy - 百度推出的高性能大模型推理与部署工具

FastDeploy - 百度推出的高性能大模型推理与部署工具

FastDeploy 是百度推出的高性能推理与部署工具，专为大语言模型（LLMs）和视觉语言模型（VLMs）设计。FastDeploy 基于飞桨（PaddlePaddle）框架开发，支持多种硬件平台...

1年前

066K

Vace AI - AI 视频制作和编辑平台，提供一站式视频创作服务

Vace AI - AI 视频制作和编辑平台，提供一站式视频创作服务

Vace AI 是强大的一站式 AI 视频制作和编辑平台。平台基于文本描述或参考图像生成高质量的视频内容，支持视频扩展、风格转换、主体移除与重建等多种编辑功能。

1年前

066K

PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5是爱诗科技推出的AI视频生成大模型。模型能根据用户输入的文字描述或图片生成高质量的视频内容，且支持多种风格，如动漫、科幻、国风等。

11个月前

066K

Z-Image - 阿里通义实验室开源的图像生成模型

Z-Image - 阿里通义实验室开源的图像生成模型

Z-Image是阿里通义实验室开源的图像生成模型，具有高效、快速和强大的图像生成能力。采用单流扩散Transformer架构（S3-DiT），将文本、视觉语义和图像VAE token整合为统一输入流...

8个月前

065.9K

nanobot - HKUDS开源的超轻量级个人AI助手框架

nanobot - HKUDS开源的超轻量级个人AI助手框架

nanobot 是香港大学数据智能实验室（HKUDS）开源的超轻量级个人AI助手框架，仅用约 4,000行Python代码实现了完整的多通道AI助手功能。作为 OpenClaw 的轻量替代品，nano...

6个月前

065.8K

EchoMimicV3 - 蚂蚁开源的多模态数字人动画生成模型

EchoMimicV3 - 蚂蚁开源的多模态数字人动画生成模型

EchoMimicV3是蚂蚁集团推出的多模态数字人视频生成模型，拥有13亿参数，能处理音频、文本、图像等多种输入，生成高质量的数字人动画。

11个月前

065.8K

PaddleOCR-VL - 百度开源的超轻量级视觉-语言模型

PaddleOCR-VL - 百度开源的超轻量级视觉-语言模型

PaddleOCR-VL是百度开源的超轻量级视觉-语言模型，专为文档解析场景优化。模型仅含0.9B参数，通过融合动态高分辨率视觉编码器与轻量级ERNIE语言模型，在保持高精度的同时显著降低计算开销。

9个月前

065.7K

ChatGPT Study - OpenAI推出的创新学习模式

ChatGPT Study - OpenAI推出的创新学习模式

ChatGPT Study 是 OpenAI 推出的创新学习模式，能帮助用户更高效地学习和理解知识。ChatGPT Study 通过苏格拉底式提问、支架式响应和个性化教学，引导用户主动思考，逐步解决问...

1年前

065.6K

CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA是淘天集团未来生活实验室团队推出的创新3D动作角色扮演游戏（ARPG）专用模型。CombatVLA是视觉-语言-动作（VLA）模型，基于3B参数规模构建，通过动作追踪器收集人类玩家的...

11个月前

065.6K

MineContext - 字节开源的主动式上下文感知AI伙伴

MineContext - 字节开源的主动式上下文感知AI伙伴

MineContext是字节跳动Viking团队开源的主动式上下文感知AI伙伴，帮助用户高效管理海量信息，提升知识工作效率。过屏幕截图和内容理解技术，自动记录用户日常操作（如浏览网页、编辑文档等），支...

10个月前

065.5K

Muzaic - AI音乐生成平台，一键生成与视频内容匹配的音乐

Muzaic - AI音乐生成平台，一键生成与视频内容匹配的音乐

Muzaic 是 AI 驱动的在线音乐生成平台，专为视频制作人和内容创作者设计。Muzaic支持基于 AI 技术快速生成与视频内容匹配的定制音乐，仅需 8 秒生成一分钟的录音室级别音轨。

1年前

065.5K

HIRING.STUDIO - AI招聘面试辅助工具，针对特定职位生成面试问题

HIRING.STUDIO - AI招聘面试辅助工具，针对特定职位生成面试问题

HIRING.STUDIO 是 AI 招聘面试辅助工具，帮助招聘团队高效创建针对特定职位的面试问题。工具基于 AI 技术，生成面试问题、建议后续问题，为不同质量的答案制定评估标准。工具支持STAR方法...

1年前

065.3K

Ring-1T-preview - 蚂蚁集团开源的万亿参数大模型

Ring-1T-preview - 蚂蚁集团开源的万亿参数大模型

Ring-1T-preview 是蚂蚁集团开源的万亿参数大模型，基于 Ling 2.0 MoE 架构，在 20T 语料上预训练，并通过自研强化学习系统 ASystem 进行推理能力训练。在自然语言推理...

10个月前

065.2K

FastVLM - 苹果公司推出的视觉语言模型

FastVLM - 苹果公司推出的视觉语言模型

FastVLM（Fast Vision Language Model）是苹果公司推出的高效视觉语言模型。以FastViTHD混合视觉编码器为核心，融合了卷积和Transformer架构，可显著减少视觉...

11个月前

065.2K

Step-Audio-AQAA – StepFun推出的端到端大音频语言模型

Step-Audio-AQAA – StepFun推出的端到端大音频语言模型

Step-Audio-AQAA 是 StepFun 团队推出的端到端大型音频语言模型，用于音频查询-音频回答（AQAA）任务。能直接处理音频输入生成自然、准确的语音回答，无需依赖传统的自动语音识别（A...

1年前

065.2K

AI Agent Company Researcher：自动化公司信息研究情报员

AI Agent Company Researcher：自动化公司信息研究情报员

综合介绍 AI公司研究助手是一个基于人工智能的工具，旨在自动化公司研究和潜在客户挖掘过程。通过使用LangGraph和FireCrawl等技术，该工具能够在短短几分钟内生成详细的公司研究报告。用户只需...

2年前

065.1K

AIMangaStudio - 免费的AI漫画创作工具，提供完整创作流程

AIMangaStudio - 免费的AI漫画创作工具，提供完整创作流程

AIMangaStudio是免费的AI漫画创作工具，为创作者提供完整的漫画创作流水线，包括剧情生成、分镜设计、角色设定等功能，能简化从脚本到漫画页面的制作流程。支持自然语言生成漫画脚本，包括剧情、对白...

10个月前

065.1K

Shortbread - AI漫画生成工具，自然语言描述完成漫画创作

Shortbread - AI漫画生成工具，自然语言描述完成漫画创作

Shortbread是AI漫画生成工具，用户基于简单的自然语言描述快速创作出完整的漫画作品。Shortbread无需任何绘图技能，只需输入文字，AI快速生成具有独特角色、场景和情感的个性化漫画。Sho...

1年前

065K

小星绪 - 京东健康推出的AI情绪漫画生成产品

小星绪 - 京东健康推出的AI情绪漫画生成产品

小星绪是京东健康推出的AI情绪漫画生成产品，目前处于测试阶段，产品以情绪驱动漫画故事生成为核心功能，用户能通过语音或文字输入表达情绪或讲述故事，AI根据输入生成匹配的四格漫画及故事解读。

1年前

065K

无问芯穹：企业级AI开发，云端资源服务平台

无问芯穹：企业级AI开发，云端资源服务平台

综合介绍无问芯穹是一个面向AI开发者的综合服务平台，提供能力强大的AI开发工具与大模型服务。该平台具有AIStudio, GenStudio等多种机器学习开发工具，同时还支持模型部署、数据存储和模型...

最新AI资源 # AI开放服务

2年前

064.9K

MoFlow - AI情绪管理应用，用自由书写调节情绪

MoFlow - AI情绪管理应用，用自由书写调节情绪

MoFlow是结合心理学与AI技术的情绪管理应用。为用户提供了一个私密空间，让用户可以通过书写、聊天等方式表达情绪，AI伙伴会耐心倾听给予反馈。

1年前

064.9K

觅果·Migo - AI学术研究助手，智能问答满足多样化需求

觅果·Migo - AI学术研究助手，智能问答满足多样化需求

觅果·Migo是AI驱动的学习与研究创新平台，具备强大的多模态AI能力，支持文本、语言、视觉和数据处理，能满足跨学科的多样化需求。觅果·Migo提供智能问答、网页辅读、文献阅读、学术写作、论文阅读、化...

1年前

064.8K

DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1是DeepSeek推出的新一代AI模型，在前代V3模型的基础上进行重要升级。DeepSeek V3.1引入混合推理架构，让模型在思考模式和非思考模式之间灵活切换，显著提高思考...

11个月前

064.8K

Paper2Any - 北大DCAI团队开源的AI科研与演示文稿生成平台

Paper2Any - 北大DCAI团队开源的AI科研与演示文稿生成平台

Paper2Any是北京大学DCAI课题组开源的多模态辅助平台，专注于从论文PDF、图片和文本中快速生成多种科研内容。具备一键生成科研绘图的功能，能从多种输入源生成模型架构图、技术路线图和实验数据图等...

7个月前

064.7K

Hyperbolic AgentKit：让Agents拥有自己的计算资源，能够自主管理 GPU、执行区块链操作和社交发布

Hyperbolic AgentKit：让Agents拥有自己的计算资源，能够自主管理 GPU、执行区块链操作和社交发布

综合介绍 Hyperbolic AgentKit是一个开源项目，旨在提供一个运行AI代理的模板，结合了区块链和计算能力。该项目基于Coinbase的CDP Agentkit进行修改和扩展，支持在终端中...

最新AI资源 # AI开放服务

2年前

064.6K

剪影专业版6.0.x，新年快乐版

剪影专业版6.0.x，新年快乐版

无需会员就可以使用所有vip功能，解压即用，千万别升级！千万别升级！千万别升级！链接：https://pan.quark.cn/s/a120ee707f47 提取码：jHDN

2年前

064.6K

Claudable - 开源AI Web应用构建器，自然语言生成代码

Claudable - 开源AI Web应用构建器，自然语言生成代码

Claudable 是基于 Next.js 的开源 Web 应用构建器，结合了 Claude Code 和 Cursor CLI 的先进 AI 代理能力，以及 Lovable 简单直观的应用构建体验...

11个月前

064.5K

靠岸妙写 - AI论文写作工具，构思到成稿一站式解决

靠岸妙写 - AI论文写作工具，构思到成稿一站式解决

靠岸妙写是AI论文写作工具，为学术写作提供高效、便捷的解决方案。工具支持一键生成论文大纲、摘要和正文初稿，适用本科、硕士等不同层次的学术需求，覆盖理工科、文科和社科等多学科领域。

1年前

064.5K

GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 是智谱推出的开源 SOTA 模型，专为智能体应用设计，融合推理、代码生成和智能体能力。模型基于混合专家（MoE）架构，包含两个版本，3550 亿参数的 GLM-4.5 和 1060 亿...

1年前

064.5K

UnifiedTTS - 一站式TTS API服务平台，实时性能监控

UnifiedTTS - 一站式TTS API服务平台，实时性能监控

UnifiedTTS 是一站式文本转语音（TTS）服务的平台。支持多种语言，包括中文、英文、日文和韩文等，能满足全球业务的需求。通过统一的 API 接口，整合多种主流的 TTS 服务，包括 Micro...

11个月前

064.4K

NeverEnds：使用文字描述生成效果逼真的视频

NeverEnds：使用文字描述生成效果逼真的视频

综合介绍 NeverEnds是一个来自新加坡的平台，通过先进的模型将文字转换成视频，为各类故事提供了一个无限的创作空间。用户可以在这个平台上自由表达创意，传达情感，以及建设自己的品牌形象。这个平台以独...

最新AI资源 # AI图像转视频 # AI文本转视频

2年前

064.3K

Goedel-Prover-V2 - 普林斯顿联合清华和英伟达等开源的定理证明模型

Goedel-Prover-V2 - 普林斯顿联合清华和英伟达等开源的定理证明模型

Goedel-Prover-V2 是普林斯顿大学、清华大学和英伟达等顶尖机构联合推出的开源定理证明模型。模型基于创新技术如分层式数据合成、验证器引导的自我修正和模型平均等，显著提升自动形式化证明的性能...

1年前

064.3K

ChatGPT Agent – OpenAI推出的通用智能AI Agent

ChatGPT Agent – OpenAI推出的通用智能AI Agent

ChatGPT Agent 是 OpenAI 推出的通用AI Agent，融合多种能力，能自主完成复杂任务。用户只需用自然语言描述需求，Agent 能自动选择合适工具，比如浏览网页、提取信息、运行代码...

1年前

064.2K

TuriX-CUA - 开源AI桌面自动化工具，AI直接操作电脑桌面

TuriX-CUA - 开源AI桌面自动化工具，AI直接操作电脑桌面

TuriX-CUA 是开源的 AI 桌面自动化工具，能通过截屏、多模态模型决策和自动化操作实现电脑交互。让 AI 模型直接操作电脑桌面环境。支持 macOS 和 Windows 系统，通过先进的计算机...

7个月前

064.1K

羚珑 - 京东推出的AI商品图设计工具

羚珑 - 京东推出的AI商品图设计工具

羚珑是京东推出的智能设计工具，为电商商家和个人提供高效便捷的设计解决方案。通过智能抠图、智能排版、智能配色等功能，帮助用户快速生成高质量的设计作品，满足商品主图、广告Banner、店铺页面等多种电商场...

1年前

064K

Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 是昆仑万维开源的高效多模态模型，专注于图像生成、编辑与理解。模型基于 2B 参数的 SD3.5-Medium 架构，通过预训练、渐进式双任务强化策略和联合训练，实...

12个月前

064K

Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

Seed GR-3 是字节跳动推出的通用机器人模型，具有强大的泛化能力，能适应新环境和复杂指令。模型融合视觉、语言和动作信息，基于机器人数据、VR 人类轨迹数据和公开图文数据的三合一训练法，提升对新物...

1年前

064K

Squibler - AI小说辅助写作平台，助力构思到创作全过程

Squibler - AI小说辅助写作平台，助力构思到创作全过程

Squibler 是强大的 AI 辅助写作平台，专为作家设计，能帮助用户从构思到创作再到出版的全过程。平台提供多种故事模板，涵盖小说、剧本、短篇故事等，用户只需输入初始概念，AI 能生成大纲、角色、场...

11个月前

063.9K

ChatFlow - 开源AI工作流自动化工具

ChatFlow - 开源AI工作流自动化工具

ChatFlow 是开源的 AI 工作流自动化工具，支持将复杂的需求转化为高效的工作流程。工具基于 AI 技术，帮助用户快速生成代码框架、测试用例，能辅助写作和设计软件架构。

1年前

063.8K

MiniMax-M1 - MiniMax推出的开源推理模型

MiniMax-M1 - MiniMax推出的开源推理模型

MiniMax-M1 是 MiniMax 团队推出的开源推理模型，基于混合专家架构（MoE）与闪电注意力机制（Lightning Attention）相结合，总参数量达 4560 亿。模型支持 100...

1年前

063.8K

Kotae - AI聊天机器人平台，分析网站内容、培训文件生成准确回答

Kotae - AI聊天机器人平台，分析网站内容、培训文件生成准确回答

Kotae是专为小型企业设计的智能聊天机器人平台，基于ChatGPT技术开发。平台支持超过80种语言，能快速自然地响应客户咨询，基于分析用户网站内容、培训文件和常见问题解答等生成准确回答。Kotae无...

1年前

063.7K

Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit 是阿里通义推出的全能图像编辑模型，基于 200 亿参数的 Qwen-Image 架构构建。模型融合语义与外观的双重编辑能力，能对图像进行低层次的视觉外观编辑（如添加、删...

12个月前

063.7K

有道小P - 网易有道推出的新一代AI全科学习助手

有道小P - 网易有道推出的新一代AI全科学习助手

有道小P是网易有道推出的AI全科学习助手，专为K12学生设计，搭载有道子曰教育大模型，覆盖小学、初中、高中全学科答疑，提供个性化学习建议。有道小P具备AI查词、AI翻译功能，帮助学生快速解决语言难题...

1年前

063.5K

JoyHallo - 京东开源的AI数字人模型

JoyHallo - 京东开源的AI数字人模型

JoyHallo是京东开源的AI数字人模型，专为普通话设计，支持将音频转化为逼真的说话视频。JoyHallo基于wav2vec2模型嵌入音频特征，用半解耦结构，提升唇部运动预测准确性，支持生成英语视频...

1年前

063.4K

VoxCPM - 面壁智能联合清华开源的端到端TTS模型

VoxCPM - 面壁智能联合清华开源的端到端TTS模型

VoxCPM 是面壁智能与清华大学深圳国际研究生院联合开源的语音生成模型。VoxCPM 采用端到端的扩散自回归架构，直接从文本生成连续语音表示，突破了传统离散分词的局限。通过分层语言建模和有限状态量化...

10个月前

063.4K

InternVLA·N1 - 上海AI Lab开源的端到端双系统导航大模型

InternVLA·N1 - 上海AI Lab开源的端到端双系统导航大模型

InternVLA·N1是上海人工智能实验室开源的端到端双系统导航大模型。采用双系统架构，系统2负责理解语言指令并规划长程路径，系统1专注于高频响应和敏捷避障。模型完全基于合成数据训练，通过大规模数字...

10个月前

063.4K

ML-Master – 上海交大推出的AI专家Agent

ML-Master – 上海交大推出的AI专家Agent

ML-Master是上海交通大学人工智能学院Agents团队推出AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色，以29.3%的平均奖牌率位居榜首，超越了微软的RD-Agent...

1年前

063.4K

Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini 是上海人工智能实验室推出的轻量化科学多模态大模型，参数规模为 8B。继承了 Intern-S1 的强大能力，兼具通用与专业科学能力，适合快速部署和二次开发。在性能方面，I...

11个月前

063.3K

DeckSpeed - AI PPT制作工具，自然语言生成演示文稿

DeckSpeed - AI PPT制作工具，自然语言生成演示文稿

DeckSpeed是AI演示文稿制作工具，基于对话式交互，用户基于自然语言表达需求，快速生成个性化幻灯片，无需依赖传统模板。工具支持实时反馈调整，用户能随时修改幻灯片的颜色、风格和内容，确保演示文稿完...

1年前

063.3K

InternVLA-A1 - 上海AI Lab开源一体化操作能力的具身大模型

InternVLA-A1 - 上海AI Lab开源一体化操作能力的具身大模型

InternVLA-A1 是上海人工智能实验室开源的具身操作大模型。具备理解、想象、执行一体化的能力，能精准地完成任务。模型融合了真实和模拟的操作数据，通过大规模虚实混合场景资产，自动化构建海量多模态...

10个月前

063.2K

gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime 是 OpenAI 推出的先进语音模型，支持直接处理音频，生成自然流畅的语音。模型支持多种语言和风格，能理解非语言线索，如笑声，能在不同语言间切换。

11个月前

063.2K

Skywork-SWE-32B - 昆仑万维开源的自主代码智能体基座模型

Skywork-SWE-32B - 昆仑万维开源的自主代码智能体基座模型

Skywork-SWE-32B是昆仑万维推出的开源的32B规模的软件工程（SWE）自主代码智能体基座模型。模型专注于软件工程任务，具备强大的仓库级代码修复能力，能在多轮交互和长文本处理的复杂场景中表现...

1年前

063.2K

Genie 3 - 谷歌推出的通用世界模型

Genie 3 - 谷歌推出的通用世界模型

Genie 3 是谷歌 DeepMind 推出的新一代通用世界模型，支持实时生成高度动态且连贯的虚拟世界。Genie 3 能模拟物理现象、自然生态系统，还支持创建奇幻场景和历史场景。用文本提示，用户能...

12个月前

063.1K

Lemon Slice Live - Lemon Slice推出的 AI 实时视频聊天工具

Lemon Slice Live - Lemon Slice推出的 AI 实时视频聊天工具

Lemon Slice Live 是 Lemon Slice 公司推出的实时视频聊天 AI 工具。Lemon Slice Live基于扩散变换器模型（DiT），支持将任意照片或插画转化为能实时互动的动...

1年前

063K

琴乐大模型 - 腾讯推出的AI音乐创作模型

琴乐大模型 - 腾讯推出的AI音乐创作模型

琴乐大模型是腾讯AI Lab与腾讯TME天琴实验室联合推出的先进AI音乐创作大模型。模型根据用户输入的中英文关键词、描述性语句或音频片段，智能生成高质量的立体声音频或多轨乐谱。

1年前

063K

HunyuanImage 3.0 - 腾讯开源的免费多模态图像生成模型

HunyuanImage 3.0 - 腾讯开源的免费多模态图像生成模型

HunyuanImage 3.0（混元图像3.0）是腾讯发布并开源的原生多模态图像生成模型。模型参数规模达80B，是目前测评效果最好、参数量最大的开源生图模型。混元图像3.0支持实时生图功能，用户可边...

10个月前

063K

RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 是智谱开源的跨本体大小脑协同框架，推动机器人从单一智能向群体协作智能转变。框架用“大小脑”架构实现高效分工，云端大脑负责复杂决策与协同，小脑模块专注于执行具体技能。

1年前

063K

Mistral Code - Mistral AI推出面向企业的AI编程助手

Mistral Code - Mistral AI推出面向企业的AI编程助手

Mistral Code是Mistral AI推出的面向企业开发团队的AI编程助手，集成Codestral、Codestral Embed、Devstral 和Mistral Medium四大模型，支...

1年前

062.9K

Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner（GE）是智元机器人团队联合新加坡国立大学、北京航空航天大学等机构开发的机器人操作统一平台。通过“先想象，后行动”的方式，让机器人更好地理解和执行任务。

12个月前

062.8K

SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 是昆仑万维集团推出的音频驱动数字人创作工具。能通过简单的输入（如人像图片和语音）生成高质量的动态视频内容，让静态照片“活”起来，可以为现有视频更换台词，人物会自动对上新的口型...

12个月前

062.7K

Hailuo Video Agent - MiniMax推出的AI视频创作Agent

Hailuo Video Agent - MiniMax推出的AI视频创作Agent

Hailuo Video Agent 是 MiniMax 稀宇科技推出的零门槛AI视频创作Agent，开放Beta版本。通过简单的文字输入或图片上传，可一键生成高质量的创意视频，涵盖多种应用场景，如广...

1年前

062.7K

gpt-oss - OpenAI推出的开源推理模型系列

gpt-oss - OpenAI推出的开源推理模型系列

gpt-oss是 OpenAI 推出的开源推理模型系列，支持为开发者提供高效、灵活且易于部署的 AI 解决方案。gpt-oss包含两个版本，gpt-oss-120B 拥有 1170 亿参数，支持在 8...

12个月前

062.7K

OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker是阿里巴巴推出的实时文本驱动的说话头像生成框架。框架能同时处理文本、图像、音频和视频等多种模态输入，基于流式方式生成自然语音响应。核心基于Thinker-Talker架构，Thin...

1年前

062.7K

ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - 阿里通义推出的音频生成模型

ThinkSound是阿里通义语音团队推出的首个CoT（链式思考）音频生成模型。模型能为视频画面生成精准匹配的音效，基于引入CoT推理，解决传统技术难以捕捉画面动态细节和空间关系的问题。

1年前

062.7K

Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 是昆仑万维推出的先进 AI 音乐生成模型，专注于中文歌曲创作。模型能精准还原音色与演奏技法，生成自然流畅且富有情感的歌声。基于优化的自动语音识别（ASR）技术，Mureka V...

12个月前

062.7K

MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架

MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架

MagicTryOn 是浙江大学计算机科学与技术学院联合 vivo 等机构推出的先进的视频虚拟试穿框架。框架用创新的扩散Transformer（DiT）架构，替代传统的U-Net架构，结合全自注意力机...

1年前

062.6K

LongCat-Video-Avatar - 美团开源的虚拟人视频生成模型

LongCat-Video-Avatar 是美团开源的基于 LongCat-Video 构建的先进音频驱动视频生成模型，专注于生成超逼真、唇部同步且具有自然动态和一致身份的长视频。

8个月前

062.6K

Moltbot - 开源的本地优先AI助手，支持多渠道与用户交互

Moltbot - 开源的本地优先AI助手，支持多渠道与用户交互

Moltbot（原名Clawdbot）是奥地利开发者 Peter Steinberger 开源的“本地优先”AI 助手，WhatsApp、Telegram、Discord、Slack、iMessage...

6个月前

062.6K

Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash 是阿里通义千问团队推出的高性能编程模型，具备卓越的代理式编程和工具调用能力，擅长处理复杂编程任务。模型支持 256K tokens 的长上下文理解，能扩展至 1M ...

1年前

062.6K

TRELLIS.2 - 微软开源的大型3D生成模型

TRELLIS.2 - 微软开源的大型3D生成模型

TRELLIS.2是微软开源的大型3D生成模型，拥有40亿参数，专注于高保真图像到3D的生成。采用创新的“O-Voxel”稀疏体素结构，能高效处理复杂拓扑和锐利特征，生成具有全PBR材质的高质量3D资...

7个月前

062.6K

GLM-5 - 智谱AI推出的旗舰级开源大模型

GLM-5 - 智谱AI推出的旗舰级开源大模型

GLM-5是智谱AI推出的旗舰级开源大模型，采用744B参数规模（激活40B），专为Agentic Engineering智能体工程打造。模型在编程与Agent能力上取得开源SOTA表现，SWE-be...

6个月前

062.5K

Hunyuan3D-Omni - 腾讯混元开源的3D模型生成框架

Hunyuan3D-Omni - 腾讯混元开源的3D模型生成框架

Hunyuan3D-Omni（混元3D-Omni）是腾讯混元3D团队开源的3D资产生成框架，通过多种控制信号实现精准的3D模型生成。基于Hunyuan3D 2.1架构，引入了统一的控制编码器，可处理点...

10个月前

062.4K

自动生成每日Product Hunt热门产品榜单

自动生成每日Product Hunt热门产品榜单

综合介绍 Product Hunt 每日中文热榜是一个基于 GitHub Actions 的自动化工具，能够每天定时生成 Product Hunt 上的热门产品榜单，并以 Markdown 文件的形式...

最新AI资源 # AI开源项目

2年前

062.4K

日日新 V6.5 - 商汤科技推出的最新多模态推理大模型

日日新 V6.5 - 商汤科技推出的最新多模态推理大模型

日日新 V6.5 是商汤科技推出的先进多模态推理大模型，专为处理图像与文本混合输入而设计，支持精准理解图像内容并结合文本生成描述或回答问题。

1年前

062.3K

Lucy Edit - 开源的AI视频编辑工具，自然语言描述编辑

Lucy Edit - 开源的AI视频编辑工具，自然语言描述编辑

Lucy Edit 是开源的 AI 视频编辑工具，由 Decart AI 开发。允许用户通过简单的自然语言描述来编辑视频，例如“将人物换成北极熊”或“把场景变成2D卡通风格”，无需复杂的微调或使用遮罩...

10个月前

062.3K

Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V 是阿里通义开源的多模态视频生成模型，只需一张静态图片和一段音频，能生成高质量的数字人视频，且支持多种图片类型和画幅。

11个月前

062.3K