AI分享圈

每日分享最新AI产品、项目、框架、论文解读等~
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks 是美团 M17 团队开源的大模型评测集,用在评估模型的指令遵循能力。Meeseeks 通过三级评测框架,从宏观到微观全面衡量模型是否能严格按照用户指令生成回答,不评估回答内容的知识正...
12小时前
01.2K
gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime 是 OpenAI 推出的先进语音模型,支持直接处理音频,生成自然流畅的语音。模型支持多种语言和风格,能理解非语言线索,如笑声,能在不同语言间切换。
16小时前
01.2K
Youtu-agent - 腾讯开源的高效智能体框架

Youtu-agent - 腾讯开源的高效智能体框架

Youtu-agent 是腾讯优图实验室开源的智能体框架,用在构建和运行自主智能体。框架在 WebWalkerQA 和 GAIA 基准测试中表现出色,准确率分别达到 71.47% 和 72.8%。框架...
1天前
03.3K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-Foley 是腾讯混元团队开源的视频音效生成模型,支持为无声视频添加精准匹配的音效。模型基于大规模数据集训练,用多模态扩散变换器架构,结合表征对齐损失函数和音频VAE优化技术...
1天前
02.6K
PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5是爱诗科技推出的AI视频生成大模型。模型能根据用户输入的文字描述或图片生成高质量的视频内容,且支持多种风格,如动漫、科幻、国风等。
2天前
03K
问小白5 - 问小白推出的全能AI模型

问小白5 - 问小白推出的全能AI模型

问小白5是“All in One”旗舰大模型,智能水平极高。模型在多项评测中表现卓越,如AA - Index综合评估得分64.7分,STEM能力评测86分,接近全球领先的GPT - 5。
2天前
03.3K
Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image(代号nano banana)是谷歌推出的先进图像生成与编辑模型,能保持角色在不同场景中的一致性,支持通过自然语言进行精准图像编辑,如模糊背景、消除污渍等。
3天前
05.5K
Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V 是阿里通义开源的多模态视频生成模型,只需一张静态图片和一段音频,能生成高质量的数字人视频,且支持多种图片类型和画幅。
3天前
05.6K
吴恩达面向开发者的ChatGPT提示工程免费课程

吴恩达面向开发者的ChatGPT提示工程免费课程

面向开发者的ChatGPT提示工程是DeepLearning.AI与OpenAI联合推出的课程,专为开发者设计,由Isa Fulford, 吴恩达Andrew Ng主讲,教授如何用大型语言模型(LLM...
3天前
05.3K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

问小白o4是创新的并行思考模型,能同时开启8条思考路径,从多角度分析问题并自动筛选出最优解。模型融合先进的Long-CoT强化学习和过程奖励学习技术,具备强大的深度推理能力,且在复杂任务中表现出色。
4天前
07.2K