新Meeseeks - 美团开源的评估模型指令遵循能力的评测集Meeseeks 是美团 M17 团队开源的大模型评测集,用在评估模型的指令遵循能力。Meeseeks 通过三级评测框架,从宏观到微观全面衡量模型是否能严格按照用户指令生成回答,不评估回答内容的知识正...最新AI资源11小时前01K
新gpt-realtime - OpenAI最新推出的AI语音模型gpt-realtime 是 OpenAI 推出的先进语音模型,支持直接处理音频,生成自然流畅的语音。模型支持多种语言和风格,能理解非语言线索,如笑声,能在不同语言间切换。最新AI资源15小时前01.2K
新Youtu-agent - 腾讯开源的高效智能体框架Youtu-agent 是腾讯优图实验室开源的智能体框架,用在构建和运行自主智能体。框架在 WebWalkerQA 和 GAIA 基准测试中表现出色,准确率分别达到 71.47% 和 72.8%。框架...最新AI资源1天前03.3K
新HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型HunyuanVideo-Foley 是腾讯混元团队开源的视频音效生成模型,支持为无声视频添加精准匹配的音效。模型基于大规模数据集训练,用多模态扩散变换器架构,结合表征对齐损失函数和音频VAE优化技术...最新AI资源1天前02.3K
新PixVerse V5 - 爱诗科技推出的自研AI视频模型PixVerse V5是爱诗科技推出的AI视频生成大模型。模型能根据用户输入的文字描述或图片生成高质量的视频内容,且支持多种风格,如动漫、科幻、国风等。最新AI资源1天前02.9K
新问小白5 - 问小白推出的全能AI模型问小白5是“All in One”旗舰大模型,智能水平极高。模型在多项评测中表现卓越,如AA - Index综合评估得分64.7分,STEM能力评测86分,接近全球领先的GPT - 5。最新AI资源2天前03.2K
MiniCPM-V 4.5 - 面壁智能开源的8B参数多模态模型MiniCPM-V 4.5 是面壁智能开源的 8B 参数多模态模型,基于 Qwen3-8B 和 SigLIP2-400M 构建,具备高效处理图像和视频的能力。在视觉 Token 消耗上表现出色,处理 ...最新AI资源2天前05K
Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型Gemini 2.5 Flash Image(代号nano banana)是谷歌推出的先进图像生成与编辑模型,能保持角色在不同场景中的一致性,支持通过自然语言进行精准图像编辑,如模糊背景、消除污渍等。最新AI资源3天前05.4K
Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型Wan2.2-S2V 是阿里通义开源的多模态视频生成模型,只需一张静态图片和一段音频,能生成高质量的数字人视频,且支持多种图片类型和画幅。最新AI资源3天前05.5K
吴恩达面向开发者的ChatGPT提示工程免费课程面向开发者的ChatGPT提示工程是DeepLearning.AI与OpenAI联合推出的课程,专为开发者设计,由Isa Fulford, 吴恩达Andrew Ng主讲,教授如何用大型语言模型(LLM...最新AI资源课程资料3天前05.1K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径问小白o4是创新的并行思考模型,能同时开启8条思考路径,从多角度分析问题并自动筛选出最优解。模型融合先进的Long-CoT强化学习和过程奖励学习技术,具备强大的深度推理能力,且在复杂任务中表现出色。最新AI资源4天前07.1K
VibeVoice - 微软推出的文本到语音模型VibeVoice 是微软推出的新型文本到语音(TTS)模型。模型能生成多达 4 位不同说话者的对话式音频,支持长达 90 分钟的连续语音输出,突破传统 TTS 系统的长度限制。最新AI资源4天前07.1K
SpatialGen - 群核科技推出的开源3D场景生成模型SpatialGen 是群核科技开源的 3D 场景生成模型,基于扩散模型架构,支持根据文字描述、参考图像和 3D 空间布局生成时空一致的多视角图像,并进一步生成 3D 高斯场景,渲染出漫游视频。最新AI资源4天前06.2K
EchoMimicV3 - 蚂蚁开源的多模态数字人动画生成模型EchoMimicV3是蚂蚁集团推出的多模态数字人视频生成模型,拥有13亿参数,能处理音频、文本、图像等多种输入,生成高质量的数字人动画。最新AI资源4天前06.4K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型Fun-ASR是钉钉与通义实验室联合推出的语音识别大模型。模型经过海量音频数据训练,能精准识别多行业专业术语,如互联网、科技、家装等,显著提升识别准确率。模型结合钉钉企业信息进行推理优化,减少幻觉问题...最新AI资源5天前08.3K
Squibler - AI小说辅助写作平台,助力构思到创作全过程Squibler 是强大的 AI 辅助写作平台,专为作家设计,能帮助用户从构思到创作再到出版的全过程。平台提供多种故事模板,涵盖小说、剧本、短篇故事等,用户只需输入初始概念,AI 能生成大纲、角色、场...最新AI资源5天前07.7K
91写作 - 开源的AI智能小说创作平台91写作是全开源的AI小说创作工具,基于Vue 3和Element Plus开发,集成多种先进AI模型,如GPT、Claude、Gemini等。工具为创作者提供从构思到成文的完整创作工具链,包括项目创...最新AI资源5天前07.1K
Aivilization - 港科大推出的多Agent社会模拟平台Aivilization 是香港科技大学开发的全球首创人工智能多智能体社会模拟平台。构建了一个可视化的数字沙盒,用户可创建和引导成千上万个 AI 智能体,观察未来人类与 AI 共存的社会演变。平台支持...最新AI资源5天前010.2K
Grok 2.5 - 马斯克旗下xAI开源的人工智能模型Grok 2.5是埃隆·马斯克旗下的xAI公司开源的人工智能模型。拥有2690亿参数,基于混合专家(MoE)架构,具有强大的性能和推理能力。模型在研究生级科学知识(GPQA)、通用知识(MMLU、MM...最新AI资源5天前08.6K
Draw A Fish - 免费的在线AI画鱼网站,共享虚拟鱼缸Draw A Fish 是简单而有趣的在线AI画鱼网站,用户可以在上面绘制鱼的图案,将其放入一个全球共享的虚拟鱼缸中。Draw A Fish无需注册,操作简单,只需几秒钟就能完成创作并分享。最新AI资源6天前08.9K
MIT最新报告《生成式AI鸿沟:2025年商业人工智能现状》MIT最新推出的《生成式AI鸿沟:2025年商业人工智能现状》报告,通过深入调研300多个AI项目、与52个组织进行访谈及对153位高管开展调查,揭示企业在生成式AI(GenAI)应用过程中遭遇的核心...最新AI资源课程资料6天前014K
AutoClip - 开源的AI视频切片工具,一键生成专题视频合集AutoClip是开源的AI视频剪辑工具,基于先进的AI技术实现全流程自动化视频处理。工具能自动识别视频中的高光片段,精准提取有价值内容,能根据主题相似度进行智能聚类,生成内容合集。AutoClip支...最新AI资源1周前010K
ToonComposer - 腾讯开源的生成式AI动画制作工具ToonComposer 是香港中文大学、腾讯 PCG ARC 实验室和北京大学共同推出的生成式 AI 动画制作工具。通过生成式后关键帧技术,将中间帧生成和上色环节整合为自动化流程,仅需一个草图和一个...最新AI资源1周前010.4K
Seed-OSS - 字节跳动团队开源的全新AI模型Seed-OSS是字节跳动Seed团队开源的大型语言模型系列,专注于长文本和推理任务。模型在复杂逻辑推理和多步推理中表现出色,准确率高,能高效解决难题。Seed-OSS支持长达512K的长文本上下文...最新AI资源1周前010.1K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型Intern-S1-mini 是上海人工智能实验室推出的轻量化科学多模态大模型,参数规模为 8B。继承了 Intern-S1 的强大能力,兼具通用与专业科学能力,适合快速部署和二次开发。在性能方面,I...最新AI资源1周前09.9K
Nano Banana - 谷歌推出的AI图像编辑模型Nano Banana 是谷歌推出的 AI 图像生成与编辑模型Gemini 2.5 Flash Image代号,能根据简单的文本提示生成细节丰富、光影真实的图像,对现有图像进行高质量的修改。最新AI资源3天前018K
Klear-Reasoner - 快手推出的全新推理模型Klear-Reasoner 是快手推出的高性能推理模型,基于 Qwen3-8B-Base 进行开发。模型通过长思维链监督微调和强化学习训练,在数学和代码推理方面表现出色。Klear-Reasoner...最新AI资源1周前09.3K
CombatVLA - 淘天集团推出的高效VLA模型CombatVLA是淘天集团未来生活实验室团队推出的创新3D动作角色扮演游戏(ARPG)专用模型。CombatVLA是视觉-语言-动作(VLA)模型,基于3B参数规模构建,通过动作追踪器收集人类玩家的...最新AI资源1周前09.8K
DeepSeek V3.1 - DeepSeek推出的最新开源AI模型DeepSeek V3.1是DeepSeek推出的新一代AI模型,在前代V3模型的基础上进行重要升级。DeepSeek V3.1引入混合推理架构,让模型在思考模式和非思考模式之间灵活切换,显著提高思考...最新AI资源1周前010.1K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型Qwen-Image-Edit 是阿里通义推出的全能图像编辑模型,基于 200 亿参数的 Qwen-Image 架构构建。模型融合语义与外观的双重编辑能力,能对图像进行低层次的视觉外观编辑(如添加、删...最新AI资源2周前09.9K
MoE-TTS - 昆仑万维推出的最新语音生成框架MoE-TTS 是昆仑万维推出的语音合成框架,基于混合专家(MoE)架构,将预训练的大型语言模型(LLM)与语音专家模块结合。MoE-TTS 通过冻结文本模块参数、仅更新语音模块参数,保留强大的文本理...最新AI资源2周前012.4K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台Genie Envisioner(GE)是智元机器人团队联合新加坡国立大学、北京航空航天大学等机构开发的机器人操作统一平台。通过“先想象,后行动”的方式,让机器人更好地理解和执行任务。最新AI资源2周前011.8K
DINOv3 - Meta AI推出的新一代自监督视觉基础模型DINOv3 是 Meta AI 推出的新一代自监督视觉基础模型,采用自监督学习范式,无需标注数据即可学习图像特征。通过改进数据准备和引入 Gram anchoring 解决了特征退化问题,提升了泛化...最新AI资源2周前016.2K
Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型Mureka V7.5 是昆仑万维推出的先进 AI 音乐生成模型,专注于中文歌曲创作。模型能精准还原音色与演奏技法,生成自然流畅且富有情感的歌声。基于优化的自动语音识别(ASR)技术,Mureka V...最新AI资源2周前012.2K
Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版Skywork Deep Research Agent v2 是昆仑万维推出的深度研究智能体,专注于多模态信息的整合与分析。Skywork Deep Research Agent v2 能处理文本、图...最新AI资源2周前010.7K
Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架Hunyuan-GameCraft 是腾讯 Hunyuan 团队开源的交互式游戏视频生成框架。框架能从单张图片和提示生成高动态的游戏视频,支持用户通过键盘和鼠标实时控制视频内容。最新AI资源2周前013.4K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型Skywork UniPic 2.0 是昆仑万维开源的高效多模态模型,专注于图像生成、编辑与理解。模型基于 2B 参数的 SD3.5-Medium 架构,通过预训练、渐进式双任务强化策略和联合训练,实...最新AI资源2周前013K
RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议RynnRCP 是阿里达摩院开源的机器人上下文协议,能降低具身智能开发门槛并打通开发全流程。RynnRCP 包含 RCP 框架和 RobotMotion 模块。RCP 框架通过能力抽象和多协议支持,将...最新AI资源2周前012.6K
RynnEC - 阿里达摩院开源的世界理解模型RynnEC是阿里巴巴达摩院推出的世界理解模型,专注于具身智能任务。模型基于多模态融合技术,结合视频数据和自然语言,能从多个维度解析场景中的物体,支持物体理解、空间感知和视频目标分割等功能。最新AI资源2周前012.9K
Matrix-3D - 昆仑万维开源的3D世界生成框架Matrix-3D 是昆仑万维 Skywork AI 团队推出的开源框架,专注于生成可探索的全景 3D 世界。框架结合全景视频生成与 3D 重建技术,能从单张图像或文本提示出发,生成高质量、全向可探索...最新AI资源2周前010.9K
GLM-4.5V - 智谱推出的多模态开源视觉推理模型GLM-4.5V是智谱推出的全球领先的开源视觉推理模型,总参数达1060亿,激活参数120亿。模型基于新一代文本基座模型GLM-4.5-Air训练而成,具备强大的视觉理解与推理能力,能处理图像、视频...最新AI资源3周前012.6K
Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研交互式世界模型。是业内首个开源的通用场景实时长序列交互式生成模型,模型通过视觉驱动的交互方案,能以 25 FPS 的速度在多...最新AI资源3周前012.6K
Baichuan-M2 - 百川智能推出开源的医疗增强大模型Baichuan-M2 是百川智能推出的开源医疗增强大模型。在医疗领域表现出色,特别是在HealthBench评测中以60.1分的成绩超越了OpenAI的gpt-oss120b等众多开源模型,成为全球...最新AI资源3周前012.2K
Qwen-Flash - 通义千问推出的高性能、低成本语言模型Qwen-Flash 是阿里巴巴通义千问系列推出的高性能、低成本的语言模型,专为快速响应和高效处理简单任务设计。基于先进的 Mixture-of-Experts (MoE) 架构,通过稀疏专家网络实现...最新AI资源3周前08.9K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具SkyReels-A3 是昆仑万维集团推出的音频驱动数字人创作工具。能通过简单的输入(如人像图片和语音)生成高质量的动态视频内容,让静态照片“活”起来,可以为现有视频更换台词,人物会自动对上新的口型...最新AI资源3周前09.3K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型MiniMax Speech 2.5 是 MiniMax 团队开发的先进语音生成模型。在语音合成领域取得了显著进步,尤其在多语种表现力、音色复刻精度和语种覆盖范围上实现了飞跃。模型支持 40 种语言...最新AI资源3周前012.7K
GPT-5 - OpenAI推出的最强语言模型,统一智能系统GPT-5是OpenAI最新发布的语言模型,具有多项升级。是一个统一智能系统,内置实时路由器,能根据问题复杂度自动切换高效模式与深度思考模式,实现快速响应与精准解答。GPT-5拥有多个版本,包括面向普...最新AI资源3周前010K
dots.vlm1 - 小红书hi lab开源的多模态大模型dots.vlm1 是小红书 hi lab 开源的首个多模态大模型。基于从零训练的 12 亿参数视觉编码器 NaViT 和 DeepSeek V3 大语言模型(LLM),具备强大的视觉感知和文本推理能...最新AI资源3周前09.3K
Genie 3 - 谷歌推出的通用世界模型Genie 3 是谷歌 DeepMind 推出的新一代通用世界模型,支持实时生成高度动态且连贯的虚拟世界。Genie 3 能模拟物理现象、自然生态系统,还支持创建奇幻场景和历史场景。用文本提示,用户能...最新AI资源3周前010.3K
Claude Opus 4.1 - Anthropic推出的最强编程模型Claude Opus 4.1 是 Anthropic 公司推出的先进大型语言模型,专为高效处理复杂任务而设计。模型在编程领域表现出色,能生成高质量代码,支持长达 32k 的单次输出,适应多种编程风格...最新AI资源3周前010.3K
gpt-oss - OpenAI推出的开源推理模型系列gpt-oss是 OpenAI 推出的开源推理模型系列,支持为开发者提供高效、灵活且易于部署的 AI 解决方案。gpt-oss包含两个版本,gpt-oss-120B 拥有 1170 亿参数,支持在 8...最新AI资源3周前010.2K
MiDashengLM - 小米开源的声音理解模型MiDashengLM 是小米开源的高效声音理解大模型,具体参数版本为MiDashengLM-7B ,专注于音频处理与理解。模型基于 Xiaomi Dasheng 音频编码器和 Qwen2.5-Omn...最新AI资源3周前010.1K
MOSS-TTSD - 清华实验室开源的双语对话语音生成模型MOSS-TTSD 是清华大学语音与语言实验室开发的开源口语对话语音生成模型。模型能将文本对话脚本转化为自然流畅且富有表现力的对话语音,支持中英文双语生成。最新AI资源3周前010.4K
AudioGen-Omni - 快手推出的多模态音频生成模型AudioGen-Omni 是快手推出的多模态音频生成模型,能基于视频、文本等输入生成高质量的音频、语音和歌曲。AudioGen-Omni 基于先进的技术,如多模态扩散Transformer和相位对齐...最新AI资源3周前09.1K
LangExtract - 谷歌开源的Python库,提取结构化信息LangExtract 是 Google 开源的 Python 库,利用大型语言模型(LLMs)从非结构化文本中提取结构化信息。通过用户定义的指令和少量示例,能高效地识别并组织关键细节,例如从临床笔记...最新AI资源3周前011.5K
Qwen-Image - 通义千问推出开源的文生图基础模型Qwen-Image是阿里巴巴通义千问团队发布的开源图像生成基础模型。拥有200亿参数,采用多模态扩散变换器架构(MMDiT),融合了多模态理解、高分辨率编码和扩散模型三大模块。Qwen-Image的...最新AI资源3周前09.3K
RedOne - 小红书最新推出的社交大模型RedOne 是小红书推出的专为社交网络定制的大语言模型。模型通过三阶段训练策略,融入社交文化知识,强化多任务能力,并对齐人类偏好。RedOne 在社交任务性能上显著优于基础模型,在有害内容检测和浏览...最新AI资源4周前010.2K
FastDeploy - 百度推出的高性能大模型推理与部署工具FastDeploy 是百度推出的高性能推理与部署工具,专为大语言模型(LLMs)和视觉语言模型(VLMs)设计。FastDeploy 基于飞桨(PaddlePaddle)框架开发,支持多种硬件平台...最新AI资源4周前09.3K
InteriorGS - 群核科技推出的3D高斯语义数据集InteriorGS是群核科技推出的高质量3D高斯语义数据集。数据集包含1000个3D场景,涵盖80多种室内环境,如家庭、便利店、婚宴厅和博物馆等。数据集中有755个类别的554,000多个对象实例...最新AI资源4周前08.4K
DragonV2.1 - 微软推出的零样本语音合成模型DragonV2.1 是微软推出的先进的零样本文本到语音(TTS)模型。模型基于 Transformer 架构,支持多语言和零样本语音克隆,仅需 5-90 秒的语音提示能生成自然、富有表现力的语音。最新AI资源4周前09.6K
ScreenCoder – 开源的UI截图生成前端代码工具ScreenCoder 是开源的智能工具,能将 UI 设计截图快速转换为高质量的 HTML/CSS 代码。工具基于模块化多智能体架构,结合视觉理解、布局规划和代码合成技术,支持生成高精度且语义化的前端...最新AI资源4周前010.1K
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型Gemini 2.5 Deep Think 是谷歌推出的 AI 推理模型,专为解决复杂任务设计。是获得 2025 年国际数学奥林匹克竞赛(IMO)金牌的模型的变体,通过并行思考技术(Parallel ...最新AI资源4周前07.8K
MindLink - 昆仑万维推出的开源推理大模型MindLink是昆仑万维推出开源的推理大模型。具有自适应推理机制,可根据任务复杂度灵活切换推理模式,简单任务快速生成,复杂任务深度推理,兼顾效率与准确性。计划驱动推理范式去掉了“think”标签,降...最新AI资源4周前08.9K
Kimi K2 高速版 - 月之暗面Kimi推出的高速版语言模型Kimi K2 高速版(kimi-k2-turbo-preview)是月之暗面Kimi推出的高性能语言模型。模型在 Kimi K2 的基础上进行优化,输出速度大幅提升,每秒可生成 40 个 Token...最新AI资源4周前010.9K
dots.ocr - 小红书hi lab推出的开源多语言文档解析模型dots.ocr是小红书hi lab开源的多语言文档解析模型,基于17亿参数的视觉语言模型(VLM),能高效地进行文档布局检测和内容识别,同时保持良好的阅读顺序。最新AI资源4周前013.8K
HYPIR - 中国科学院团队推出的新型图像复原大模型HYPIR 是中国科学院深圳先进技术研究院董超团队推出的图像复原大模型。模型结合扩散模型的分数先验与对抗生成网络,实现高效、高质量的图像复原。HYPIR 能快速修复老照片、提升分辨率,同时保持文字清晰...最新AI资源4周前011.4K
FLUX.1 Krea [dev] - 黑森林和Krea AI联合推出的文生图模型FLUX.1 Krea [dev] 是 Black Forest Labs 和 Krea AI 联合推出的文生图模型。模型根据输入的文本描述,能生成高质量、逼真的图像,具有独特的美学风格,避免传统 A...最新AI资源4周前010K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型Qwen3-Coder-Flash 是阿里通义千问团队推出的高性能编程模型,具备卓越的代理式编程和工具调用能力,擅长处理复杂编程任务。模型支持 256K tokens 的长上下文理解,能扩展至 1M ...最新AI资源4周前09.5K
Wide Research - Manus平台推出的多智能体协同功能Wide Research 是 Manus 平台推出的强大功能,专为处理复杂且大规模的任务而设计。平台通过系统级的并行处理机制和智能体协作协议,能支持上百个通用智能体同时工作。最新AI资源4周前09.3K
Seed Diffusion - 字节跳动最新推出的扩散语言模型Seed Diffusion 是字节跳动推出的实验性扩散语言模型,能处理代码生成任务。模型基于两阶段扩散训练、约束顺序学习和强化高效并行解码等技术,显著提升推理速度,达到2146 tokens/s,比...最新AI资源4周前010.1K
小星绪 - 京东健康推出的AI情绪漫画生成产品小星绪是京东健康推出的AI情绪漫画生成产品,目前处于测试阶段,产品以情绪驱动漫画故事生成为核心功能,用户能通过语音或文字输入表达情绪或讲述故事,AI根据输入生成匹配的四格漫画及故事解读。最新AI资源4周前08.5K
1688 AI版 - 阿里旗下1688平台推出的AI生意助手1688 AI版是阿里巴巴旗下1688平台推出的智能生意助手应用,专为小B买家和商家设计。应用基于1688平台海量数据,提供商机推送、选品推荐、创意生成、企业查询等功能,帮助用户精准把握市场动态、快速...最新AI资源4周前08.4K
阶跃深研 - 阶跃星辰推出的AI深入研究工具阶跃深研是阶跃星辰推出的高效AI研究工具,能在短时间内自主完成复杂问题的研究并生成专业报告。工具专为金融、咨询、医疗、法律等领域设计,凭借深度搜索与信息整合能力,在行业评测中表现优异。最新AI资源4周前08.5K
Runway Aleph - Runway推出的全新AI视频编辑模型Runway Aleph 是 Runway 推出的先进 AI 视频编辑模型,基于简单文字指令,快速实现视频内容的增删、风格转换、环境调整和镜头运动优化等功能。用户无需复杂操作,轻松移除多余元素、改变场...最新AI资源1个月前09.7K
WebShaper - 阿里通义开源的AI训练数据合成系统WebShaper 是阿里巴巴通义实验室推出的 AI 训练数据合成系统,基于形式化建模和智能体扩展机制,生成高质量、可扩展的训练数据,助力 AI 智能体提升复杂信息检索能力。系统引入“知识投影”概念...最新AI资源1个月前09.8K
Skywork UniPic - 昆仑万维推出的开源多模态统一预训练模型Skywork UniPic 是昆仑万维开源的多模态预训练模型,具备图像理解、文本生成图像和图像编辑三大核心能力。模型基于自回归架构,融合 MAR 编码器和 SigLIP2 主干,用 1.5B 参数规...最新AI资源1个月前09.9K
ChatGPT Study - OpenAI推出的创新学习模式ChatGPT Study 是 OpenAI 推出的创新学习模式,能帮助用户更高效地学习和理解知识。ChatGPT Study 通过苏格拉底式提问、支架式响应和个性化教学,引导用户主动思考,逐步解决问...最新AI资源1个月前09.3K
通义万相Wan2.2 - 阿里推出的开源AI视频生成模型通义万相Wan2.2是阿里巴巴开源的先进AI视频生成模型,总参数量达270亿。模型包含文生视频、图生视频和统一视频生成三种模式,能根据文本描述、图片或两者的结合生成高质量视频。最新AI资源1个月前011.8K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型GLM-4.5 是智谱推出的开源 SOTA 模型,专为智能体应用设计,融合推理、代码生成和智能体能力。模型基于混合专家(MoE)架构,包含两个版本,3550 亿参数的 GLM-4.5 和 1060 亿...最新AI资源1个月前010.5K
Coze Studio - 字节跳动推出的开源AI Agent开发平台Coze Studio 是字节跳动开源的 AI 智能体开发平台,专为开发者设计,能简化 AI 应用的构建、部署与管理。Coze Studio提供一站式开发环境,支持 Prompt、RAG、Plugin...最新AI资源1个月前011K
Coze Loop – 字节Coze开源的AI Agent开发与调试平台Coze Loop 是字节跳动旗下 Coze 平台开源的 AI 智能体开发与运维管理平台。平台为开发者提供从开发、调试到评估、监控的全生命周期管理,涵盖提示词工程、Agent 效果评测、性能监控与调优...最新AI资源1个月前010.8K
悟能 - 商汤科技最新推出的具身智能平台悟能是商汤科技推出的具身智能平台,专为机器人和智能设备设计。悟能基于“开悟”世界模型与多模态大模型技术,整合视觉、语音、触觉等多传感器输入,具备强大的感知、决策和行动能力。最新AI资源1个月前09.7K
Intern-S1 - 上海AI Lab开源的科学多模态大模型Intern-S1是上海人工智能实验室推出的科学多模态大模型。模型将语言和多模态能力深度融合,具备跨模态科学解析、语言与视觉融合、科学数据处理、科学问题解答、实验设计与优化等强大功能。最新AI资源1个月前010K
混元3D世界模型 1.0 - 腾讯推出的开源3D世界生成模型混元3D世界模型 1.0(Hunyuan World 1.0 )是腾讯开源的业界首个可沉浸漫游、可交互、可仿真的世界生成模型。模型融合全景视觉生成与分层3D重建技术,支持用文字或图片输入,快速生成36...最新AI资源1个月前09.3K
日日新 V6.5 - 商汤科技推出的最新多模态推理大模型日日新 V6.5 是商汤科技推出的先进多模态推理大模型,专为处理图像与文本混合输入而设计,支持精准理解图像内容并结合文本生成描述或回答问题。最新AI资源1个月前08.6K
Opal - 谷歌推出的AI工作流创建平台Opal 是谷歌实验室推出的创新 AI 小应用生成平台,能帮助用户快速创建和分享 AI 应用,无需编写代码。Opal 通过自然语言交互和可视化编辑界面,让用户能轻松地将提示、模型调用和工具串联成多步骤...最新AI资源1个月前010K
Qwen-MT - 阿里通义推出的机器翻译模型Qwen-MT 是阿里通义千问团队推出的先进Qwen-MT - 阿里通义推出的机器翻译模型,基于强大的 Qwen3 架构,支持 92 种语言的互译,覆盖全球 95% 以上人口。模型基于轻量级 MoE ...最新AI资源1个月前09.6K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型Agentar-Fin-R1是蚂蚁数科推出的面向金融领域的先进大语言模型。模型基于强大的Qwen3架构开发,提供8B和32B两种参数规模版本,能精准处理复杂的金融推理任务,包括多步骤分析、风险评估和战...最新AI资源1个月前08.9K
MonkeyCode - 开源的企业级AI编程助手MonkeyCode 是开源的企业级本地 AI 编程助手,专为注重隐私和安全的开发团队设计。MonkeyCode 支持私有化部署和离线使用,确保代码数据安全。工具功能强大,包括智能代码补全、自然语言编...最新AI资源1个月前09.9K
Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型Seed LiveInterpret 2.0 是字节跳动 Seed 团队推出的先进同声传译模型,支持中英双向翻译。模型具备接近真人水平的翻译准确率和极低延迟,平均语音到语音延迟仅 2 - 3 秒,较传...最新AI资源1个月前07.9K
Excel MCP Server - 基于MCP的AI Excel处理工具Excel MCP Server 是基于 Model Context Protocol (MCP) 的服务器工具,无需安装 Microsoft Excel 就能操作 Excel 文件。Excel MC...最新AI资源1个月前011.4K
ChatFlow - 开源AI工作流自动化工具ChatFlow 是开源的 AI 工作流自动化工具,支持将复杂的需求转化为高效的工作流程。工具基于 AI 技术,帮助用户快速生成代码框架、测试用例,能辅助写作和设计软件架构。最新AI资源1个月前09.4K
Mureka V7 - 昆仑万维推出的AI音乐生成模型Mureka V7 是昆仑万维推出的先进 AI 音乐生成模型。模型基于 MusiCoT 技术,支持先规划音乐的整体结构,再填充细节,生成更具连贯性和艺术性的音乐作品。最新AI资源1个月前08.2K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型Seed GR-3 是字节跳动推出的通用机器人模型,具有强大的泛化能力,能适应新环境和复杂指令。模型融合视觉、语言和动作信息,基于机器人数据、VR 人类轨迹数据和公开图文数据的三合一训练法,提升对新物...最新AI资源1个月前09.1K
Qwen3-Coder - 阿里通义千问开源的的代码生成模型Qwen3-Coder 是阿里通义千问团队推出的先进代码生成模型。模型拥有 480B 参数和 35B 激活参数,支持原生 256K token 上下文,能扩展至 1M token。模型基于混合专家架构...最新AI资源1个月前09.1K
OpenReasoning-Nemotron - 英伟达推出的开源系列推理模型OpenReasoning-Nemotron 是英伟达开源的一系列大型语言模型,支持处理数学、科学和代码领域的推理任务。模型基于 DeepSeek R1 0528 模型蒸馏而成,参数规模有 1.5B...最新AI资源1个月前08K
Seed-X - 字节跳动推出的开源多语言翻译模型Seed-X 是字节跳动 Seed 团队推出的多语言翻译模型,具备 70 亿参数,支持 28 种语言的双向翻译。模型融合多语言数据预训练、指令微调和强化学习技术,能高效处理复杂语言模式,让翻译质量更出...最新AI资源1个月前011.5K
JoyAgent-JDGenie - 京东开源的轻量化通用多智能体系统JoyAgent-JDGenie 是京东开源的轻量化通用多智能体系统,无需二次开发能直接使用。JoyAgent-JDGenie 能处理复杂任务,如生成报告、分析数据等,支持多种交付格式,如网页、PPT...最新AI资源1个月前010.6K
TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手TRAE SOLO 是字节跳动推出的AI编程助手TRAE 推出的AI 自动化开发助手,用AI技术简化软件开发流程。TRAE SOLO能理解用户的需求,支持文字描述、语音指令和文件上传输入需求,自动规划...最新AI资源1个月前013.3K