AI分享圈

每日分享最新AI产品、项目、框架、论文解读等~

文章284 网址49 书籍0 软件0 评论0

已发布284

rStar2-Agent - 微软开源的高效AI推理模型

rStar2-Agent是微软开源的先进的人工智能数学推理模型，在AIME24测试中达到80.6%的准确率，展现出强大的数学问题解决能力。模型具备科学推理能力，在GPQA-Diamond基准测试中达到...

最新AI资源

11个月前

052.5K

InfinityHuman - 字节联合浙大推出的长视频数字人生成模型

InfinityHuman 是字节跳动与浙江大学联合推出的商用级长时序音频驱动人物视频生成模型。模型通过音频驱动，能生成高分辨率、长时长且视觉一致的人物视频。

最新AI资源

11个月前

056K

Kimi K2-0905 - 月之暗面推出的最新模型版本

Kimi K2-0905 是月之暗面科技有限公司推出的先进 AI 模型，在编程辅助方面表现出色，能高效生成代码，支持在前端开发中生成整洁规范的代码。模型上下文长度扩展至 256K，能处理复杂任务。

最新AI资源

11个月前

093.9K

Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks 是美团 M17 团队开源的大模型评测集，用在评估模型的指令遵循能力。Meeseeks 通过三级评测框架，从宏观到微观全面衡量模型是否能严格按照用户指令生成回答，不评估回答内容的知识正...

最新AI资源

11个月前

058.8K

gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime 是 OpenAI 推出的先进语音模型，支持直接处理音频，生成自然流畅的语音。模型支持多种语言和风格，能理解非语言线索，如笑声，能在不同语言间切换。

最新AI资源

11个月前

063K

Youtu-agent - 腾讯开源的高效智能体框架

Youtu-agent 是腾讯优图实验室开源的智能体框架，用在构建和运行自主智能体。框架在 WebWalkerQA 和 GAIA 基准测试中表现出色，准确率分别达到 71.47% 和 72.8%。框架...

最新AI资源

11个月前

073K

HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-Foley 是腾讯混元团队开源的视频音效生成模型，支持为无声视频添加精准匹配的音效。模型基于大规模数据集训练，用多模态扩散变换器架构，结合表征对齐损失函数和音频VAE优化技术...

最新AI资源

11个月前

074.2K

PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5是爱诗科技推出的AI视频生成大模型。模型能根据用户输入的文字描述或图片生成高质量的视频内容，且支持多种风格，如动漫、科幻、国风等。

最新AI资源

11个月前

065.7K

问小白5 - 问小白推出的全能AI模型

问小白5是“All in One”旗舰大模型，智能水平极高。模型在多项评测中表现卓越，如AA - Index综合评估得分64.7分，STEM能力评测86分，接近全球领先的GPT - 5。

最新AI资源

11个月前

059.3K

Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image（代号nano banana）是谷歌推出的先进图像生成与编辑模型，能保持角色在不同场景中的一致性，支持通过自然语言进行精准图像编辑，如模糊背景、消除污渍等。

最新AI资源

11个月前

060.9K

加载更多