最新AI资源

共 3143 篇文章

课程资料最新AI资源 AI知识库 AI新闻

排序

浏览收藏

Doppl - 谷歌推出的AI虚拟试衣应用

Doppl是谷歌推出的AI虚拟试衣应用。用户上传全身照片后，应用支持将服装图片或截图“穿”在数字版自己身上，且能将静态图片转换为AI生成的视频，让用户更真切地感受服装上身效果。

最新AI资源

1年前

062.2K

悟能 - 商汤科技最新推出的具身智能平台

悟能是商汤科技推出的具身智能平台，专为机器人和智能设备设计。悟能基于“开悟”世界模型与多模态大模型技术，整合视觉、语音、触觉等多传感器输入，具备强大的感知、决策和行动能力。

最新AI资源

1年前

062.1K

MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型

MinerU2.5是上海人工智能实验室与北京大学团队联合研发的解耦式视觉语言模型，专注于高效处理高分辨率文档图像解析。核心创新在于采用"先全局版面检测后局部内容识别"的两阶段设计：第一阶段通过低分辨率...

最新AI资源

9个月前

062.1K

FireRed-Image-Edit - 小红书团队开源的通用图像编辑模型

FireRed-Image-Edit 是小红书 Super Intelligence 团队开源的通用图像编辑模型，基于扩散 Transformer 架构，在 GEdit、ImgEdit 等多个权威评测...

最新AI资源

5个月前

062.1K

EmbodiChain - 跨维智能推出的开源具身智能开发平台

EmbodiChain是跨维智能推出的开源具身智能开发平台，专注于解决具身智能模型训练中数据稀缺的问题。通过数据引擎实现大规模场景相关数据生成、Real2Sim 数据轨迹映射和多模态数据扩增，从根本上...

最新AI资源

6个月前

062.1K

Molmo 2 - Ai2开源的多模态视频图像理解模型系列

Molmo 2是Allen Institute for AI（Ai2）发布的开源多模态模型，提升视频和多图像理解能力。包含三个变体：Molmo 2（8B）、Molmo 2（4B）和Molmo 2-O...

最新AI资源

8个月前

062K

Step-Audio 2 mini - 阶跃星辰开源的语音大模型

Step-Audio 2 mini 是阶跃星辰开源的端到端语音大模型。突破传统语音模型结构，采用真端到端多模态架构，直接将原始音频输入转化为语音响应输出，时延更低，能理解副语言信息与非人声信号。

最新AI资源

11个月前

062K

EXAONE 4.0 - LG推出的混合推理模型

EXAONE 4.0是韩国LG AI Research推出的混合推理大模型，融合通用自然语言处理和高级推理能力。模型支持韩语、英语和西班牙语，分为32B的专业版和1.2B的端侧版。专业版适用法律、会计...

最新AI资源

1年前

062K

OpenAI《在AI时代保持领先》PDF指南 - 附下载链接

《Staying ahead in the age of AI》是OpenAI推出的AI领导力指南，助力企业领导者在AI时代保持竞争优势。指南指出AI发展迅猛，模型发布速度加快、成本降低，企业采用速度...

最新AI资源课程资料

11个月前

061.9K

DeepSeek-R1 - DeepSeek推出的AI推理模型，性能对齐 OpenAI o1 正式版

DeepSeek-R1是杭州深度求索公司DeepSeek推出的高性能AI推理模型，对标OpenAI的o1正式版。模型基于大规模强化学习技术进行后训练，仅需极少量标注数据，便能在数学、代码和自然语言推理...

最新AI资源

1年前

061.8K

Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1是阿里巴巴集团Ovis团队推出的多模态统一模型，参数规模达到30亿。模型具备多模态理解、文本到图像生成以及图像编辑等三大核心能力，凭借先进的架构设计和协同统一训练方法，支持实现高保真图像...

最新AI资源

1年前

061.8K

Tencent-HY-MT1.5 - 腾讯混元开源的翻译模型系列

Tencent-HY-MT1.5是腾讯混元开源的翻译模型1.5版本，包含1.8B和7B两个模型，支持33种国际语言及5种民汉/方言互译。1.8B模型专为手机等消费级设备优化，仅需1GB内存即可实现端侧...

最新AI资源

7个月前

061.8K

全球首个量子 AI 模型问世！SECQAI 发布 QLLM 即将进入 Beta 测试

英国超安全软硬件公司 SECQAI 宣布推出全球首个量子大语言模型 (QLLM)，将量子计算技术整合至传统 AI 模型中，以提升运算效率和问题解决能力。量子力学 + AI = 更强大的 AI？ ...

最新AI资源

1年前

061.7K

Step-GUI - 阶跃星辰开源的AI Agent系列模型

Step-GUI是阶跃星辰公司开源的AI Agent系列模型，包括云端模型Step-GUI、首个面向GUI Agent的MCP协议，以及业内首个支持手机部署的开源端侧模型Step-GUI Edge。专...

最新AI资源

7个月前

061.7K

OpenScreen - 开源免费的屏幕录制工具，支持Mac和Windows双系统

OpenScreen 是开源免费的屏幕录制工具，为用户提供一个简单易用且功能完善的 Screen Studio 替代品。支持 Mac 和 Windows 双系统，完全免费且遵循 MIT 协议，可用于个...

最新AI资源

8个月前

061.5K

AnimaTensor - 吐司AI等机构推出的二次元图像生成模型

AnimaTensor 是 CagliostroLab 团队与 TensorArt 联合推出的二次元图像生成模型，基于创新的 V-Prediction 技术，用预测图像生成过程中的“速度”优化噪声调度...

最新AI资源

1年前

061.5K

Klic Studio - AI音视频翻译配音工具，一键部署全流程

Klic Studio（原Krillin AI）是基于AI的视频翻译、配音和语音克隆工具，专为视频创作者和内容出海者设计。支持一键部署全流程，可将视频从下载到成品输出一键完成，适配抖音、小红书、B站...

最新AI资源

1年前

061.4K

ChartAI - AI数据分析工具，智能推荐适合的图表类型

ChartAI 是高效的数据可视化工具，基于 AI 技术自动分析数据，生成直观的图表，帮助用户快速理解复杂信息。ChartAI支持多种数据格式（如 Excel、CSV）的导入，支持智能推荐最适合的图表...

最新AI资源

1年前

061.4K

AudioFly - 科大讯飞开源的文本生成音效AI模型

AudioFly是科大讯飞开源的文本生成音效的AI模型。基于潜在扩散模型架构，拥有10亿个参数，经过大规模、多样化的音频文本数据集训练，涵盖AudioSet、AudioCaps、TUT等公开数据集及内...

最新AI资源

10个月前

061.4K

商汤如影 - 商汤科技推出的AI数字人视频制作平台

商汤如影是商汤科技推出的AI数字人视频制作平台。平台基于大模型技术，支持创建高度逼真的数字人形象，支持个性化定制，包括面部特征、服装、发型等。平台具备声音克隆、视频生成、自动化数据标注、实时互动等功能...

最新AI资源

1年前

061.4K

Paper2Slides - 香港大学开源的学术论文转为幻灯片AI工具

Paper2Slides是香港大学数据智能实验室开源的AI工具，可一键将学术论文转换为专业幻灯片或海报。采用RAG（检索增强生成）技术，直接解析文档内容而非依赖网络信息，确保生成的PPT与原文高度一致...

最新AI资源

8个月前

061.3K

优雅YOYA - 中科闻歌推出的AI音视频内容创作平台

优雅YOYA是中科闻歌推出的多模态文生视频平台，平台基于AI多模态技术赋能视频内容创作全链路。用户只需输入主题要求，平台能快速生成脚本、图像、视频，且能完成智能剪辑、语音合成和人物口型驱动等操作，输出...

最新AI资源

1年前

061.3K

FineVision - Hugging Face推出的开源视觉语言数据集

FineVision 是 Hugging Face 开源的视觉语言数据集，为训练先进的视觉语言模型。包含 1730 万张图像、2430 万个样本、8890 万轮对话和 95 亿个答案标记。数据集聚合了...

最新AI资源

11个月前

061.3K

json-render - Vercel Labs开源的AI生成UI的工具

json-render是Vercel Labs开源的AI生成UI的工具，通过“AI → JSON → UI”的流程实现结构化、可控的界面生成。要求AI仅输出符合预定义Schema的JSON数据，前端再...

最新AI资源

6个月前

061.2K

Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image（代号nano banana）是谷歌推出的先进图像生成与编辑模型，能保持角色在不同场景中的一致性，支持通过自然语言进行精准图像编辑，如模糊背景、消除污渍等。

最新AI资源

11个月前

061.2K

DeepSeek-OCR 2 - DeepSeek团队开源的新一代OCR模型

DeepSeek-OCR 2是DeepSeek团队开源的新一代OCR模型，核心创新在于采用DeepEncoder V2架构，将传统固定栅格扫描的视觉编码方式升级为基于语义推理的动态处理。模型通过因果流...

最新AI资源

6个月前

061.1K

DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 是微软推出的先进的零样本文本到语音（TTS）模型。模型基于 Transformer 架构，支持多语言和零样本语音克隆，仅需 5-90 秒的语音提示能生成自然、富有表现力的语音。

最新AI资源

1年前

061.1K

Higress MCP - 今日投资推出的MCP服务平台

Higress MCP 是今日投资推出的创新型平台，支持将传统金融数据API快速转化为现代化的MCP服务。Higress MCP基于简单配置即可实现REST API到MCP Server的转换，无需编...

最新AI资源

1年前

061K

Magentic-UI - 微软开源的人机协作AI Agent

Magentic-UI是微软开源的人机协作AI Agent研究工具。Magentic-UI基于与用户紧密协作，助力完成复杂的Web任务，比如网页浏览、代码执行和文件处理等。工具强调协作规划，让用户能提...

最新AI资源

1年前

061K

企鹅读伴 - 腾讯推出的中小学生AI阅读助手

企鹅读伴是腾讯推出的专为中小学生设计的AI阅读助手。企鹅读伴依托腾讯混元大模型和元器平台，结合《义务教育语文课程方案和课程标准（2022年版）》，为学生提供个性化阅读推荐、多种阅读模式（专注、朗读、听...

最新AI资源

1年前

060.9K

FactSnap - 新一代AI信息核查工具

FactSnap是新一代AI信息核查工具，帮助用户快速验证网页信息的真实性。通过集成多种模型和搜索引擎，在用户浏览网页时对选中的文字进行实时核查。

最新AI资源

1年前

060.9K

VoxCPM 1.5 - 面壁智能开源的端到端文本到语音模型

VoxCPM 1.5 是面壁智能发布的开源语音生成模型，基于无需分词器的文本到语音（TTS）技术，具有多项创新和改进。采用端到端的扩散自回归架构，直接从文本生成连续的语音波形，避免了传统分词方法的局限...

最新AI资源

8个月前

060.9K

Qwen-Image-Layered - 阿里团队开源的AI图像编辑模型

Qwen-Image-Layered是阿里团队开源的AI图像编辑模型，能将普通图片智能分解为独立的透明图层，实现类似Photoshop的精准编辑。模型采用Apache 2.0协议开源，支持灵活控制图层...

最新AI资源

7个月前

060.9K

通义DeepResearch - 阿里通义开源的深度研究智能体

通义DeepResearch（Tongyi DeepResearch）是阿里巴巴推出的开源智能体，专为深度信息检索和复杂任务推理设计，具备300亿参数，支持多种推理模式，包括ReAct模式和深度模式...

最新AI资源

11个月前

060.8K

MonkeyCode - 开源的企业级AI编程助手

MonkeyCode 是开源的企业级本地 AI 编程助手，专为注重隐私和安全的开发团队设计。MonkeyCode 支持私有化部署和离线使用，确保代码数据安全。工具功能强大，包括智能代码补全、自然语言编...

最新AI资源

1年前

060.8K

Why My Wife Yelling At Me：模拟婚姻沟通的互动工具

综合介绍 “Why My Wife Yelling At Me”是一个独特的婚姻关系模拟网站，旨在通过人工智能帮助用户理解伴侣的情感反应和沟通模式。用户可以输入不同场景，体验虚拟伴侣的反应，模拟真实的...

最新AI资源

1年前

060.8K

QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max是阿里通义推出的先进的视觉推理模型，是QVQ-72B-Preview的升级版。模型能“看懂”图片和视频内容，结合信息进行分析、推理和问题解决。QVQ-Max主要功能包括图像解析、视频分析...

最新AI资源

1年前

060.7K

Lumina-DiMOO - 上海AI Lab联合华为昇腾开源的多模态大模型

Lumina-DiMOO是上海人工智能实验室联合华为昇腾在2025年世界人工智能大会上推出的新一代多模态生成与理解统一模型。基于昇腾AI基础软硬件平台与MindSpeed MM多模态大模型套件，完成了...

最新AI资源

11个月前

060.7K

RedOne - 小红书最新推出的社交大模型

RedOne 是小红书推出的专为社交网络定制的大语言模型。模型通过三阶段训练策略，融入社交文化知识，强化多任务能力，并对齐人类偏好。RedOne 在社交任务性能上显著优于基础模型，在有害内容检测和浏览...

最新AI资源

1年前

060.7K

CRIC深度智联 - 克而瑞推出的中国房地产首个AI Agent

CRIC深度智联是克而瑞自主研发的中国房地产首个AI智能体，基于克而瑞20年房地产行业经验和数据积累与多模态大模型技术，打通数据整合、智能分析到内容生成全链路。

最新AI资源

1年前

060.6K

Hyprnote - 开源的本地优先AI会议笔记工具

Hyprnote 是开源的本地优先 AI 会议笔记工具，专为专业人士设计，保护用户隐私并提升会议效率。采用“本地优先”原则，所有数据存储和处理均在用户本地设备上完成，确保数据安全，支持离线运行。

最新AI资源

11个月前

060.6K

FlowAct-R1 - 字节跳动开源的实时交互数字人视频生成框架

FlowAct-R1是字节跳动开源的实时交互数字人视频生成框架，能通过单张参考图和音频流式生成无限时长的高保真全身动态视频。核心创新在于分块流式生成技术，将视频拆解为0.5秒一小段接力处理，配合结构化...

最新AI资源

6个月前

060.5K

Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

Kandinsky 5.0是俄罗斯AI团队开发的最新视频生成模型系列，主打轻量化设计与高性能表现。系列首款模型Kandinsky 5.0 Video Lite仅20亿参数却超越了同类14B大模型，尤其...

最新AI资源

10个月前

060.5K

分析 civitai 226K 得到的常用正负面提示词

资源列表前10 1000 个最常见的 Tokens 1000 个最常见的负面 Tokens 20 个最常见的采样器 100 个最常见的步骤 100 个最常见的尺寸 50 个最常见的...

最新AI资源 # AI图像生成辅助工具

2年前

060.5K

Confucius3-Math - 网易有道推出专注于数学教育的开源推理模型

Confucius3-Math是网易有道开源的国内首个专注于数学教育的开源推理模型。具有140亿参数，专为K-12数学教育场景优化，可在单块消费级GPU（如RTX 4090D）上高效运行，推理性能约为...

最新AI资源

1年前

060.4K

Qwen VLo – 通义千问推出的多模态统一理解与生成模型

Qwen VLo 是通义千问团队推出的多模态统一理解与生成模型。能“看懂”世界，能基于理解进行高质量的再创造，实现了从感知到生成的跨越。能精准理解图像内容，在此基础上进行一致性和高质量的生成。

最新AI资源

1年前

060.3K

职达AI简历 - AI简历生成与优化平台，精准分析问题、提供优化建议

职达AI简历是高效便捷的智能简历生成与优化平台。平台基于AI技术，帮助用户快速生成专业个性化的简历。用户只需输入基本信息和经历，平台能在短时间内生成优质简历，提供2800+精美模板，覆盖多种岗位。

最新AI资源

1年前

060.3K

Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

Skywork Deep Research Agent v2 是昆仑万维推出的深度研究智能体，专注于多模态信息的整合与分析。Skywork Deep Research Agent v2 能处理文本、图...

最新AI资源

12个月前

060.3K

稿定AI社区 - AI创意内容设计平台，多种设计资源满足不同创作需求

稿定AI社区是在线AI创意灵感平台，为用户提供丰富的创意设计资源和工具。平台涵盖多种设计领域，包括形象照、电商设计、节日主题、3D插画、头像设计、小红书素材、人像设计等，满足不同用户的需求。

最新AI资源

1年前

060.3K

2024年自动化流程执行创作工作的14款出色AI工具

如果您希望利用人工智能的力量来协助日常事务，并在个人和工作生活中实现工作流程自动化，那么您可能会对现有的多款 AI 工具感兴趣。 AssemblyAI 制作了一段五分钟的视频，详细介绍了您可以用来自动...

最新AI资源

2年前

060.2K

Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 是昆仑万维推出的先进 AI 音乐生成模型。模型基于 MusiCoT 技术，支持先规划音乐的整体结构，再填充细节，生成更具连贯性和艺术性的音乐作品。

最新AI资源

1年前

060.1K

AntSK FileChunk - 免费的AI语义文档切片工具，动态切片调整

AntSK FileChunk 是免费的智能文档切片工具，专为 RAG（检索增强生成）应用设计。以语义为核心，将文档智能切分为语义完整、连贯的片段，支持多语言，可动态调整切片大小，确保上下文连贯性。

最新AI资源

11个月前

060.1K

Magistral - Mistral AI 推出的系列推理模型

Magistral 是 Mistral AI 推出的推理模型，专注透明、多语言和特定领域的推理能力。模型包含开源版（Magistral Small）和企业版（Magistral Medium），后者在...

最新AI资源

1年前

060K

Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型

Seed LiveInterpret 2.0 是字节跳动 Seed 团队推出的先进同声传译模型，支持中英双向翻译。模型具备接近真人水平的翻译准确率和极低延迟，平均语音到语音延迟仅 2 - 3 秒，较传...

最新AI资源

1年前

060K

NitroGen - 英伟达联合斯坦福大学、加州理工等开源的游戏AI模型

NitroGen是英伟达联合斯坦福大学、加州理工学院等机构研发的开源游戏AI模型，能玩转超1000款不同类型游戏。模型基于GROOT N1.5架构，通过分析4万小时游戏视频数据（含手柄操作标注），实现...

最新AI资源

7个月前

059.9K

AntAngelMed - 蚂蚁联合浙江省卫生健康信息中心开源的医疗大模型

AntAngelMed（蚂蚁·安诊儿医疗大模型）是浙江省卫生健康信息中心、蚂蚁健康、浙江省安诊儿医学人工智能科技有限公司联合开发的开源医疗大模型。模型采用混合专家架构（MoE），总参数量达1000亿...

最新AI资源

7个月前

059.9K

Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1是蚂蚁数科推出的面向金融领域的先进大语言模型。模型基于强大的Qwen3架构开发，提供8B和32B两种参数规模版本，能精准处理复杂的金融推理任务，包括多步骤分析、风险评估和战...

最新AI资源

1年前

059.7K

问小白5 - 问小白推出的全能AI模型

问小白5是“All in One”旗舰大模型，智能水平极高。模型在多项评测中表现卓越，如AA - Index综合评估得分64.7分，STEM能力评测86分，接近全球领先的GPT - 5。

最新AI资源

11个月前

059.7K

IQuest-Coder-V1 - 至知创新研究院开源的代码大模型系列

IQuest-Coder-V1是九坤投资旗下至知创新研究院研发的开源代码大模型系列，专注于代码智能领域，具备自动编程、Bug修复和代码解释等能力。模型采用创新的Code-Flow训练范式，从代码库演化...

最新AI资源

7个月前

059.6K

SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen 是群核科技开源的 3D 场景生成模型，基于扩散模型架构，支持根据文字描述、参考图像和 3D 空间布局生成时空一致的多视角图像，并进一步生成 3D 高斯场景，渲染出漫游视频。

最新AI资源

11个月前

059.5K

FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat 是小红书开源的全双工语音交互系统，具有实时双向对话能力，支持可控打断功能。采用模块化设计，包括转录控制模块、交互模块和对话管理器等，支持级联和半级联架构，可灵活部署。

最新AI资源

10个月前

059.4K

MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS 是昆仑万维推出的语音合成框架，基于混合专家（MoE）架构，将预训练的大型语言模型（LLM）与语音专家模块结合。MoE-TTS 通过冻结文本模块参数、仅更新语音模块参数，保留强大的文本理...

最新AI资源

12个月前

059.4K

Qwen3Guard - 阿里Qwen开源的安全模型

Qwen3Guard 是基于 Qwen3 基础模型微调的安全防护模型，专为安全检测而设计。能对提示词和响应进行精确的安全分类，提供风险等级，支持英语、中文和多语言环境。Qwen3Guard 有两个专业...

最新AI资源

10个月前

059.4K

ClawFeed - 开源AI新闻摘要工具，一站式聚合任意网站内容

ClawFeed是开发者Kevin He推出的开源AI新闻摘要工具，解决信息过载问题。通过聚合Twitter、RSS、GitHub等多平台信息源，利用AI自动生成4小时、每日、每周和每月的结构化摘要...

最新AI资源

5个月前

059.3K

MindLink - 昆仑万维推出的开源推理大模型

MindLink是昆仑万维推出开源的推理大模型。具有自适应推理机制，可根据任务复杂度灵活切换推理模式，简单任务快速生成，复杂任务深度推理，兼顾效率与准确性。计划驱动推理范式去掉了“think”标签，降...

最新AI资源

1年前

059.2K

Xiaomi-MiMo-Audio - 小米开源的首个原生端到端语音大模型

Xiaomi-MiMo-Audio 是小米开源的70亿参数端到端语音大模型，具备多语言对话、语音续写、少样本泛化和音频理解等强大功能，能在语音智能和音频理解基准测试中达到SOTA水平，超越谷歌Gemi...

最新AI资源

10个月前

059.1K

Midjourney V1- Midjourney推出的首个图生视频模型

Midjourney V1 是Midjourney公司推出的首个 AI 视频生成模型，借助先进的AI技术，支持将静态图片转化为生动的动态视频。用户只需上传图片或用 Midjourney 生成的图像，点...

最新AI资源

1年前

059K

Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks 是美团 M17 团队开源的大模型评测集，用在评估模型的指令遵循能力。Meeseeks 通过三级评测框架，从宏观到微观全面衡量模型是否能严格按照用户指令生成回答，不评估回答内容的知识正...

最新AI资源

11个月前

059K

MiniMax Music 1.5 - MiniMax最新推出的AI音乐生成模型

MiniMax Music 1.5 是先进的 AI 音乐生成工具，支持根据用户的自然语言描述，生成长达4分钟的音乐作品。模型支持多种音乐风格和情绪定制，生成的人声音色自然饱满，转音顺畅，编曲层次丰富...

最新AI资源

11个月前

059K

Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think 是谷歌推出的 AI 推理模型，专为解决复杂任务设计。是获得 2025 年国际数学奥林匹克竞赛（IMO）金牌的模型的变体，通过并行思考技术（Parallel ...

最新AI资源

1年前

059K

文心大模型X1.1 - 百度推出的深度思考模型，理解能力更强

文心大模型X1.1是百度推出的深度思考模型，基于混合强化学习框架，专注于提升语言理解和生成能力。模型在处理复杂问题、遵循指令和模拟智能体行为方面表现出色，能准确地提供知识性答案和高质量的文本内容。

最新AI资源

11个月前

059K

飞算JavaAI - AI Java开发助手，自然语言实现全流程智能化开发

飞算JavaAI是飞算科技推出的智能Java开发助手。平台支持自然语言输入，实现从需求分析到代码生成的全流程智能化开发。开发者只需输入需求描述，飞算JavaAI能精准理解、生成完整的工程代码框架，平台...

最新AI资源

1年前

058.8K

Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview 是通义千问发布的最新旗舰大语言模型。是 Qwen3 系列中参数量最大的模型，参数规模超过 1 万亿。模型在推理、指令跟随、多语言支持和长尾知识覆盖等方面有重大改进...

最新AI资源

11个月前

058.6K

PaCoRe - 阶跃星辰开源的并行协同AI推理框架

PaCoRe（Parallel Coordinated Reasoning）是阶跃星辰（StepFun）开源的创新的并行协同推理框架，通过大规模并行思考机制，从多个角度同时探索问题解决方案，突破了传统...

最新AI资源

8个月前

058.5K

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge 是月之暗面（Moonshot AI）推出的浏览器扩展 + 本地桥接服务，专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...

最新AI资源

2个月前

058.4K

Youtu-GraphRAG - 腾讯优图实验室开源的图检索增强生成框架

Youtu-GraphRAG 是腾讯优图实验室开源的图检索增强生成框架，帮助大语言模型更精准地处理复杂问答任务。通过构建四层知识树，将知识拆解为属性、关系、关键词和社区四个层次，实现跨领域知识的自主演...

最新AI资源

11个月前

058.3K

Report mAIstro：生成任意自定义主题的详细报告文档，例如商业分析、年终汇报等

综合介绍报告生成工具（Report mAIstro）是一个强大的工具，旨在通过自然语言处理技术，帮助用户轻松创建自定义报告。该工具利用LangChain技术，将用户提供的主题和结构转化为详细的报告内...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

058.2K

Vibe Kanban - 开源的免费AI编程代理任务管理工具

Vibe Kanban是开源的AI编程代理任务管理工具，专为同时使用多个AI编程助手（如Claude Code、Gemini CLI、Codex等）的开发者设计。通过看板形式统一管理任务进度，支持并行...

最新AI资源

7个月前

058.2K

万兴天幕 – 万兴科技推出AIGC视频创作平台

万兴天幕是万兴科技推出的AIGC视频创作平台，覆盖视频、图片及音频生成三大创作领域，专为传媒和文化产业工作者、影视/后期工作者、艺术与设计工作者、广告和营销从业者等打造，提供一站式专业创作解决方案。

最新AI资源

1年前

058.2K

Logics-Parsing - 阿里开源的文档解析模型

Logics-Parsing 是阿里开源的端到端文档解析模型，基于 Qwen2.5-VL-7B。通过强化学习优化文档布局分析和阅读顺序推断，能将 PDF 图像转换为结构化 HTML 输出，支持多种内容...

最新AI资源

10个月前

058.2K

Qwen3-Coder-Next - 阿里通义千问开源的编程智能体混合模型

Qwen3-Coder-Next是阿里巴巴通义千问团队开源的专为编程智能体设计的高效混合模型，基于80B总参数的Qwen3-Next架构，推理时仅激活3B参数。核心创新在于采用环境交互和强化学习训练方...

最新AI资源

6个月前

058K

Stand-In - 腾讯微信视觉开源的轻量级视频生成框架

Stand-In 是腾讯微信视觉团队推出的轻量级、即插即用的身份保留视频生成框架。专注于在视频生成中保留特定身份特征，仅需训练基础模型1%的额外参数，能在人脸相似度和自然度方面取得优异效果。

最新AI资源

11个月前

057.7K

DeepSeek-OCR - DeepSeek开源的光学字符识别模型

DeepSeek-OCR 是 DeepSeek 团队开源的先进光学字符识别（OCR）模型，通过“上下文光学压缩”技术，将文本转换为图像，利用视觉 token 进行压缩和解码，实现高效长文本处理。

最新AI资源

9个月前

057.7K

MobiAgent - 上海交大开源的移动端智能体全栈构建框架

MobiAgent 是上海交通大学 IPADS 实验室开源的移动端智能体工具链，帮助用户构建专属的手机智能助手。通过记录用户操作轨迹并生成高质量数据，训练出能理解自然语言指令的智能体。核心特点包括高效...

最新AI资源

11个月前

057.4K

WebWeaver - 阿里通义开源的新型双智能体框架

WebWeaver是阿里巴巴通义团队推出的新型双智能体框架，主要用在开放性深度研究，能模拟人类研究过程，分为规划和写作两个智能体。

最新AI资源

11个月前

057.4K

Ming-Omni-tts - 蚂蚁联合Inclusion AI开源的多模态音频生成模型

Ming-Omni-tts 是蚂蚁集团与Inclusion AI联合开源的多模态音频生成模型，包含0.5B和16.8B-A3B两个版本。模型首次实现了语音、环境音和音乐的统一自回归生成，支持语速、音量...

最新AI资源

5个月前

057.4K

Klear-Reasoner - 快手推出的全新推理模型

Klear-Reasoner 是快手推出的高性能推理模型，基于 Qwen3-8B-Base 进行开发。模型通过长思维链监督微调和强化学习训练，在数学和代码推理方面表现出色。Klear-Reasoner...

最新AI资源

11个月前

057.1K

Nemotron 3 - 英伟达发布的开源 AI 模型系列

Nemotron 3 是英伟达发布的开源 AI 模型系列，包含 Nano、Super 和 Ultra 三种规格。采用混合潜在专家混合（latent MoE）架构，显著提升推理效率并降低运行成本。其中...

最新AI资源

8个月前

057.1K

Qwen3.5 - 阿里通义千问团队开源的最新一代大语言模型

Qwen3.5是阿里巴巴通义千问团队开源的最新一代大语言模型，属于千问（Qwen）系列的升级版本。Qwen3.5突破了传统文本模型的限制，实现了真正的原生多模态理解，可直接处理文本、图像、视频等多种模...

最新AI资源

5个月前

057.1K

HunyuanWorld-Voyager - 腾讯开源的超长漫游世界模型

HunyuanWorld-Voyager（简称混元Voyager）是腾讯发布的业界首个支持原生3D重建的超长漫游世界模型。是一种新颖的视频扩散框架，能从单张图片生成用户定义相机路径的3D点云序列，支持...

最新AI资源

11个月前

057K

Qwen3-VL-Embedding - 阿里通义团队开源的多模态嵌入模型

Qwen3-VL-Embedding是阿里通义团队开源的多模态嵌入模型，属于Qwen3-VL系列，主要用于跨模态检索任务。模型将文本、图像、视频等不同模态数据映射到同一语义空间，通过双塔架构生成向量表...

最新AI资源

7个月前

056.9K

PersonaPlex - 英伟达开源的全双工语音对话模型

PersonaPlex是英伟达开源的全双工语音对话模型，拥有70亿参数。摒弃了传统的语音识别→语言模型→文本到语音的级联流程，采用统一的Transformer架构，能同步处理语音理解与生成。模型支持全...

最新AI资源

6个月前

056.8K

OneCAT - 美团联合上海交大开源的多模态模型

OneCAT是美团联合上海交大推出的新型统一多模态模型，采用纯解码器架构，能无缝集成多模态理解、文本到图像生成和图像编辑功能。模型摒弃了传统多模态模型中依赖外部视觉编码器和分词器的设计，通过特定模态的...

最新AI资源

11个月前

056.6K

Ming-flash-omni 2.0 - 蚂蚁集团开源的全模态大模型

Ming-flash-omni 2.0是蚂蚁集团开源的全模态大模型，集成了视觉、语音和生成能力的AI模型，在多项基准测试中性能领先。支持同时生成语音、环境音效和音乐，能通过自然语言指令精细控制音色、语...

最新AI资源

5个月前

056.6K

Gemini Robotics On-Device - 谷歌推出首个在本地运行的具身智能模型

Gemini Robotics On-Device 是谷歌 DeepMind 推出的支持在机器人本地运行的视觉-语言-动作模型。模型能离线执行任务，依据自然语言指令完成精细动作，如叠衣服、拉开袋子等...

最新AI资源

1年前

056.6K

Qwen3-Omni - 阿里通义推出的全模态AI模型

Qwen3-Omni 是阿里通义团队推出的全模态 AI 模型，能处理文本、图像、音频和视频等多种数据类型，支持 119 种语言的文本交互，具备低延迟和高度可控的特点。

最新AI资源

10个月前

056.6K

FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext是Black Forest Labs推出的图像生成与编辑模型，提供上下文感知的图像处理技术。模型能理解响应文本和图像提示，执行对象修改、风格转换、背景替换等任务，同时保持角...

最新AI资源

1年前

056.6K

混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

混元世界模型1.5（Tencent HY WorldPlay）是腾讯发布的业界首个开源的实时世界模型框架，涵盖数据、训练、流式推理部署等全链路。核心是WorldPlay自回归扩散模型，采用Next-F...

最新AI资源

7个月前

056.5K

VTP - MiniMax海螺视频团队开源的视觉生成模型技术

VTP（Visual Tokenizer Pre-training）是MiniMax海螺视频团队提出的视觉生成模型关键技术，通过改进视觉分词器（tokenizer）的预训练方法提升生成系统性能。传统方...

最新AI资源

7个月前

056.5K

加载更多