Latest AI Resources

Total 2985 articles posts

Course materials Latest AI Resources AI Knowledge Base AI News

Sorting

Views Collect

meso- (chemistry)AlphaClaw - 熵简科技推出的金融投研 AI Agent 工具

AlphaClaw 是熵简科技推出的金融投研 AI 工具，搭载于 AlphaEngine 平台，被誉为"投研小龙虾"。完成了从"有问必答的 AI 助手"向"自主执行的 AI 分析师"的进化，能独立跑通...

Latest AI Resources

14hrs ago

01.4K

meso- (chemistry)ArkClaw - 火山引擎推出的云端AI助手，零门槛部署OpenClaw

ArkClaw是火山引擎推出的云端智能助手平台，基于OpenClaw架构构建，让用户无需繁琐配置可快速部署专属AI Agent。

Latest AI Resources

14hrs ago

01.6K

meso- (chemistry)GPT-5.3 Instant - OpenAI推出的GPT-5系列快速响应版本模型

GPT-5.3 Instant 是 OpenAI 发布的 ChatGPT 主力模型升级版，主打"体验优化"而非参数堆叠。精准解决了用户长期诟病的"说教感"和机械回复问题，对话语气更自然直接，大幅减少了...

Latest AI Resources

14hrs ago

01.7K

meso- (chemistry)Fun-CosyVoice3.5 - 阿里通义实验室推出的第三代语音合成大模型

Fun-CosyVoice3.5是阿里通义实验室推出的第三代语音合成大模型，主打"自然语言指令控制"能力，用户可直接用口语化描述（如"语气坚定一点""语速慢一点"）来调节合成语音的情绪、语速和风格，无...

Latest AI Resources

14hrs ago

01.3K

Gemini 3.1 Flash-Lite - Google推出的最轻量、最具性价比的模型

Gemini 3.1 Flash-Lite 是 Google 发布的 Gemini 3 系列中最轻量、最具性价比的模型，主打极致速度与低成本。模型从 Gemini 3 Pro 蒸馏而来，输入价格仅 ...

Latest AI Resources

3dys ago

04.7K

FireRed-OCR - 小红书团队开源的端到端文档解析模型

FireRed-OCR 是小红书 Super Intelligence 团队开源的端到端文档解析模型，基于 Qwen3-VL-2B 架构打造，仅用 2B 参数就在 OmniDocBench v1.5 ...

Latest AI Resources

3dys ago

05.8K

DuClaw - 百度智能云推出的OpenClaw云部署服务

DuClaw是百度智能云推出的托管式OpenClaw服务，专为无技术背景用户设计。DuClaw免除了服务器配置、镜像选择和API密钥管理的繁琐步骤，用户订阅后可在网页端直接调用完整的智能体功能。

Latest AI Resources

3dys ago

05K

小艺Claw - 华为推出的个人手机AI助理，一键接入OpenClaw

小艺Claw是华为基于OpenClaw开源框架推出的AI智能体，集成于小艺App中。小艺Claw打破传统语音助手"被动应答"的交互逻辑，具备自主规划与任务执行能力，可独立完成办公文档处理、信息检索、服...

Latest AI Resources

3dys ago

06.1K

GPT‑5.4 - OpenAI推出的全能旗舰AI模型

GPT-5.4是OpenAI推出的旗舰AI模型，专为复杂专业场景设计。模型突破性融合推理、编程、原生计算机操控与深度搜索四大能力，在OSWorld测试中首次超越人类操作水平，知识工作任务表现达专家级标...

Latest AI Resources

3dys ago

04.1K

Mobile-Agent-v3.5 - 阿里通义开源的原生GUI Agent框架

Mobile-Agent-v3.5是阿里巴巴通义实验室开源的新一代多平台GUI Agent框架，支持桌面、手机、浏览器三大平台，可跨Android、Ubuntu、macOS、Windows实现自动化操...

Latest AI Resources

5dys ago

08.1K

gws - 谷歌开源的CLI工具，支持接入各类AI Agent系统

gws 是 Google Workspace 团队推出的命令行工具，采用 Rust 构建。工具支持运行时动态生成命令，通过读取 Google Discovery Service 实时适配所有 Work...

Latest AI Resources

5dys ago

06.8K

HY-WU - 腾讯混元开源的实时神经参数生成框架

HY-WU（混元无相）是腾讯混元推出的功能性神经记忆框架，能在AI推理时即时创建个性化适配参数。框架为每个任务"临时定制"专属技能，无需重新训练模型。

Latest AI Resources

5dys ago

06.5K

MiroFish - 开源的AI预测引擎，智能体进行自由交互与社会演化

MiroFish是中科大20岁学生BaiFu开源的AI预测引擎，基于多智能体技术，能从新闻、小说等种子信息自动构建高保真平行数字世界。

Latest AI Resources

5dys ago

07.7K

ClawFeed - 开源AI新闻摘要工具，一站式聚合任意网站内容

ClawFeed是开发者Kevin He推出的开源AI新闻摘要工具，解决信息过载问题。通过聚合Twitter、RSS、GitHub等多平台信息源，利用AI自动生成4小时、每日、每周和每月的结构化摘要...

Latest AI Resources

2wks ago

027.6K

FireRed-Image-Edit - 小红书团队开源的通用图像编辑模型

FireRed-Image-Edit 是小红书 Super Intelligence 团队开源的通用图像编辑模型，基于扩散 Transformer 架构，在 GEdit、ImgEdit 等多个权威评测...

Latest AI Resources

3wks ago

029.2K

OpenAkita - 开源的自进化AI助手框架，多平台无缝协作

OpenAkita是开源的自进化AI助手框架，提供智能、灵活且易于使用的AI辅助工具。每日自动执行内存整合、错误自检与修复、任务复盘，遇到卡壳时自动生成新技能并安装依赖，越用越聪明。支持Windows...

Latest AI Resources

3wks ago

027.9K

ClawWork - 香港大学数据科学实验室开源的AI经济压力测试框架

ClawWork是香港大学数据科学实验室开发的AI经济压力测试框架，允许AI在模拟经济环境中完成真实工作任务并获得报酬。核心逻辑是让初始资金仅10美元的AI通过完成220个专业任务（覆盖制造、金融、医...

Latest AI Resources

3wks ago

022.7K

Ming-Omni-tts - 蚂蚁联合Inclusion AI开源的多模态音频生成模型

Ming-Omni-tts 是蚂蚁集团与Inclusion AI联合开源的多模态音频生成模型，包含0.5B和16.8B-A3B两个版本。模型首次实现了语音、环境音和音乐的统一自回归生成，支持语速、音量...

Latest AI Resources

3wks ago

023.6K

Qwen3.5 - 阿里通义千问团队开源的最新一代大语言模型

Qwen3.5是阿里巴巴通义千问团队开源的最新一代大语言模型，属于千问（Qwen）系列的升级版本。Qwen3.5突破了传统文本模型的限制，实现了真正的原生多模态理解，可直接处理文本、图像、视频等多种模...

Latest AI Resources

3wks ago

026.1K

Ring-2.5-1T - 蚂蚁百灵开源的万亿参数混合线性架构思考模型

Ring-2.5-1T 是蚂蚁集团百灵大模型团队开源的全球首个万亿参数混合线性架构思考模型，采用1:7 MLA与Lightning Linear Attention混合设计，激活参数量达63B。模型在...

Latest AI Resources

4wks ago

023.8K

Xiaomi-Robotics-0 - 小米开源的首代具身智能大模型

Xiaomi-Robotics-0 是小米开源的首代具身智能大模型，拥有47亿参数，采用"大脑+小脑"混合架构设计。视觉语言大脑基于多模态大模型，负责理解人类模糊指令与空间推理；动作执行小脑则通过Di...

Latest AI Resources

4wks ago

024.6K

AionUi - 免费开源的多AI Agent桌面应用

AionUi是一个免费开源的多AI Agent桌面应用，支持将Gemini CLI、Claude Code等命令行AI工具整合到图形界面，提供本地文件操作、多会话管理、跨平台运行等功能。支持macOS...

Latest AI Resources

4wks ago

031.3K

Ming-flash-omni 2.0 - 蚂蚁集团开源的全模态大模型

Ming-flash-omni 2.0是蚂蚁集团开源的全模态大模型，集成了视觉、语音和生成能力的AI模型，在多项基准测试中性能领先。支持同时生成语音、环境音效和音乐，能通过自然语言指令精细控制音色、语...

Latest AI Resources

4wks ago

025.6K

Protenix-v1 - 字节Seed团队推出的首个开源蛋白质结构预测模型

Protenix-v1是字节跳动ByteDance Seed团队推出的首个开源蛋白质结构预测模型，性能在严格对齐训练数据和模型规模后超越AlphaFold 3。模型具备显著的推理时扩展特性：通过增加采...

Latest AI Resources

4wks ago

024K

Clawra - 基于OpenClaw框架开源的AI女友程序

Clawra是一个基于OpenClaw框架开发的AI女友程序，由韩国开发者David Im制作，具有完整人设和交互功能。通过Persona Engineering技术赋予AI“18岁亚裔女性练习生”的...

Latest AI Resources

4wks ago

025.3K

GLM-5 - 智谱AI推出的旗舰级开源大模型

GLM-5是智谱AI推出的旗舰级开源大模型，采用744B参数规模（激活40B），专为Agentic Engineering智能体工程打造。模型在编程与Agent能力上取得开源SOTA表现，SWE-be...

Latest AI Resources

1mos ago

027.3K

nanobot - HKUDS开源的超轻量级个人AI助手框架

nanobot 是香港大学数据智能实验室（HKUDS）开源的超轻量级个人AI助手框架，仅用约 4,000行Python代码实现了完整的多通道AI助手功能。作为 OpenClaw 的轻量替代品，nano...

Latest AI Resources

1mos ago

032.3K

RynnBrain - 阿里巴巴达摩院开源的具身智能大脑基础模型

RynnBrain 是阿里巴巴达摩院开源的具身智能大脑基础模型，为机器人提供深度环境理解和物理世界交互能力。是业界首个赋予机器人时空记忆和物理空间推理能力的开源模型。包含2B、8B、30B等7个不同参...

Latest AI Resources

1mos ago

016.9K

PaperBanana - 北大与谷歌联合开源的AI学术插图自动生成框架

PaperBanana是北大与谷歌团队联合开源的AI学术插图自动生成框架，专门解决科研人员绘制方法示意图和统计图表的痛点。框架通过五个智能体协作（检索、规划、造型、渲染和批评），实现从文本描述到Neu...

Latest AI Resources

1mos ago

022.5K

Intern-S1-Pro - 上海AI Lab开源的首个万亿参数科学多模态大模型

Intern-S1-Pro是上海人工智能实验室开源的全球首个万亿参数级科学多模态大模型。采用512专家MoE架构，激活仅8专家22B参数，兼顾性能与效率。模型基于SAGE架构，引入傅里叶位置编码，统一...

Latest AI Resources

1mos ago

019K

LingBot-VA - 蚂蚁灵波开源的首个“自回归视频-动作世界模型”

LingBot-VA 是蚂蚁灵波开源的全球首个“自回归视频-动作世界模型”，把视频生成与机器人控制塞进同一 Transformer，每一步同时输出下一帧世界画面和对应动作，实现“边想边干”。

Latest AI Resources

1mos ago

021.9K

MiniCPM-o 4.5 - 面壁智能开源的 9B 全模态旗舰模型

MiniCPM-o 4.5 是面壁智能开源的 9B 全模态旗舰模型，以“边看边听主动说”的端到端架构，在手机端即可跑出 GPT-4o 级体验：支持单图、多图、高帧率长视频、实时语音双工对话，首 tok...

Latest AI Resources

1mos ago

025.5K

SoulX-FlashTalk - Soul App AI团队开源的实时数字人生成模型

SoulX-FlashTalk是Soul App AI团队开源的实时数字人生成模型，拥有140亿参数量，实现了0.87秒超低延迟和32帧/秒的高帧率。模型通过双向蒸馏技术解决了传统数字人延迟高、画面易...

Latest AI Resources

1mos ago

024.3K

Qwen3-Coder-Next - 阿里通义千问开源的编程智能体混合模型

Qwen3-Coder-Next是阿里巴巴通义千问团队开源的专为编程智能体设计的高效混合模型，基于80B总参数的Qwen3-Next架构，推理时仅激活3B参数。核心创新在于采用环境交互和强化学习训练方...

Latest AI Resources

1mos ago

026.9K

GLM-OCR - 智谱开源的 0.9B 轻量级专业 OCR 模型

GLM-OCR 是智谱开源的 0.9B 轻量级专业 OCR 模型，在 OmniDocBench V1.5 以 94.6 分刷新 SOTA。兼顾“小体积”与“全场景”，扫描、手写、印章、多语混排、复杂表...

Latest AI Resources

1mos ago

026.4K

Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

Step 3.5 Flash 是阶跃星辰开源的 1960 亿稀疏 MoE 模型，每 token 仅激活 110 亿参数，能在代码任务跑出 350 token/s 的实时速度。基于自研 MTP-3 多 ...

Latest AI Resources

1mos ago

020.4K

UnifoLM-VLA-0 - 宇树科技开源的首款操作型大模型

UnifoLM-VLA-0 是宇树科技 UnifoLM 系列的首款操作型大模型，突破传统视觉语言模型（VLM）仅能理解图像文字的局限，通过在机器人操作数据上的持续预训练，实现从"图文理解"向具备物理常...

Latest AI Resources

1mos ago

021K

SenseNova-MARS - 商汤科技开源的多模态搜索推理Agent语言模型

SenseNova-MARS 是商汤开源的首个支持动态视觉推理与图文搜索深度融合的智能体视觉语言模型（Agentic VLM），提供 8B 和 32B 双版本。模型能自主规划任务步骤、调用多种工具（如...

Latest AI Resources

1mos ago

018.8K

MOVA - 创智学院联合模思智能开源的端到端音视频生成模型

MOVA（MOSS-Video-and-Audio）是上海创智学院 OpenMOSS 团队联合模思智能（MOSI）开源的端到端音视频生成模型，是中国首个高性能开源音视频模型。突破了传统"先画面后配音...

Latest AI Resources

1mos ago

019.9K

LingBot-World - 蚂蚁旗下灵波科技开源的交互式世界模型

LingBot-World 是蚂蚁集团旗下具身智能公司灵波科技（Robbyant）开源的交互式世界模型，专为具身智能、自动驾驶及游戏开发打造高保真“数字演练场”。模型通过可扩展数据引擎从大规模游戏环境...

Latest AI Resources

1mos ago

022.5K

SkyReels-V3 - 昆仑万维Skywork AI开源的多模态视频生成模型

SkyReels-V3是昆仑万维Skywork AI开源的多模态视频生成模型，被誉为视频生成领域的"全能型"标杆。模型基于"一核多支"的统一架构，在单一建模框架内集成三大核心能力：参考图像转视频、智能...

Latest AI Resources

1mos ago

023.1K

LingBot-Depth - 蚂蚁灵波科技开源的高精度空间感知模型

LingBot-Depth是蚂蚁灵波科技开源的高精度空间感知模型，专门解决机器人在透明玻璃、反光物体等复杂场景中的深度识别难题。模型通过创新的"掩码深度建模"技术，在RGB图像基础上预测缺失的深度值

Latest AI Resources

2mos ago

022.4K

DeepSeek-OCR 2 - DeepSeek团队开源的新一代OCR模型

DeepSeek-OCR 2是DeepSeek团队开源的新一代OCR模型，核心创新在于采用DeepEncoder V2架构，将传统固定栅格扫描的视觉编码方式升级为基于语义推理的动态处理。模型通过因果流...

Latest AI Resources

2mos ago

029.4K

Kimi K2.5 - 月之暗面开源的新一代旗舰模型

Kimi K2.5 是月之暗面发布的开源旗舰模型，采用 1T MoE 架构、激活 32B、上下文 256K token，原生支持图文视频多模态输入。在 Agent、代码、视觉理解三大基准均列开源第一...

Latest AI Resources

2mos ago

024.1K

Moltbot - 开源的本地优先AI助手，支持多渠道与用户交互

Moltbot（原名Clawdbot）是奥地利开发者 Peter Steinberger 开源的“本地优先”AI 助手，WhatsApp、Telegram、Discord、Slack、iMessage...

Latest AI Resources

2mos ago

035.8K

json-render - Vercel Labs开源的AI生成UI的工具

json-render是Vercel Labs开源的AI生成UI的工具，通过“AI → JSON → UI”的流程实现结构化、可控的界面生成。要求AI仅输出符合预定义Schema的JSON数据，前端再...

Latest AI Resources

2mos ago

027.2K

FlowAct-R1 - 字节跳动开源的实时交互数字人视频生成框架

FlowAct-R1是字节跳动开源的实时交互数字人视频生成框架，能通过单张参考图和音频流式生成无限时长的高保真全身动态视频。核心创新在于分块流式生成技术，将视频拆解为0.5秒一小段接力处理，配合结构化...

Latest AI Resources

2mos ago

030.4K

VibeVoice-ASR - 微软开源的统一语音转文本（ASR）模型

VibeVoice-ASR是微软开源的统一语音转文本（ASR）模型，专为处理长音频设计，可一次性处理长达60分钟的连续音频，确保语义连贯性和说话人追踪的一致性。支持自定义热词功能，用户可输入特定词汇或...

Latest AI Resources

2mos ago

025.9K

Chroma 1.0 - FlashLabs开源的全球首个实时端到端语音对话模型

Chroma 1.0是FlashLabs发布的全球首个开源的实时端到端语音对话模型，兼具低延迟交互、高保真个性化语音克隆和强对话能力。通过紧密耦合语音理解与生成，采用1:2文本-音频token调度策略...

Latest AI Resources

2mos ago

023.2K

AgentCPM-Report - 清华联合面壁智能等开源的深度调研智能体工具

AgentCPM-Report 是清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合研发的深度调研智能体工具。基于 8 亿参数的模型，通过深度检索和推理，能生成万字长篇...

Latest AI Resources

2mos ago

022K

EmbodiChain - 跨维智能推出的开源具身智能开发平台

EmbodiChain是跨维智能推出的开源具身智能开发平台，专注于解决具身智能模型训练中数据稀缺的问题。通过数据引擎实现大规模场景相关数据生成、Real2Sim 数据轨迹映射和多模态数据扩增，从根本上...

Latest AI Resources

2mos ago

035.6K

Step3-VL-10B - 阶跃星辰开源的100亿参数多模态AI模型

Step3-VL-10B是阶跃星辰团队开源的100亿参数多模态AI模型，核心突破在于以轻量化设计实现顶级性能。模型通过统一预训练策略（1.2T多模态令牌数据）和创新的并行协同推理技术（PACORE...

Latest AI Resources

2mos ago

022.6K

PersonaPlex - 英伟达开源的全双工语音对话模型

PersonaPlex是英伟达开源的全双工语音对话模型，拥有70亿参数。摒弃了传统的语音识别→语言模型→文本到语音的级联流程，采用统一的Transformer架构，能同步处理语音理解与生成。模型支持全...

Latest AI Resources

2mos ago

024.8K

GLM-4.7-Flash - 智谱开源的混合专家架构语言模型

GLM-4.7-Flash是智谱开源的混合专家架构语言模型，参数规模为30B，激活参数量3B，上下文窗口达200K，最大输出令牌为128K。在编程能力上表现出色，SWE-bench验证集分数达59.2...

Latest AI Resources

2mos ago

021.7K

NovaSR - 开源的音频超分辨率模型，提升音频采样率

NovaSR是开源的音频超分辨率模型，主要用于将低质量音频（如16kHz采样率的电话音质）提升为高质量音频（如48kHz采样率的录音室级音质）。模型大小仅52KB，比一张微信表情包还小，可轻松部署在资...

Latest AI Resources

2mos ago

020.9K

FLUX.2 [klein] - Black Forest Labs 开源的轻量级图像生成与编辑模型

FLUX.2 [klein] 是 Black Forest Labs 推出的开源轻量级图像生成与编辑模型，专为快速推理和低延迟应用场景设计。支持文本生成图像、图像编辑以及多参考图像生成，能在不到1秒内...

Latest AI Resources

2mos ago

029.8K

TranslateGemma - 谷歌开源的机器翻译模型系列

TranslateGemma是谷歌推出的基于Gemma 3的开源机器翻译模型系列，专为提升翻译质量而设计。通过两阶段微调（监督微调和强化学习）优化翻译效果，提供4B、12B、27B三种参数规模，支持5...

Latest AI Resources

2mos ago

017.8K

OpenWork - 开源AI Agent工作流桌面应用，Claude Cowork的免费平替

OpenWork是开源的智能代理工作流桌面应用，作为Claude Cowork的免费替代品，提供可视化操作界面和本地化运行能力。项目采用Tauri+Rust+Node.js技术栈，支持技能插件扩展和模...

Latest AI Resources

2mos ago

063.3K

ArenaRL - 高德地图联合阿里通义开源的对比式强化学习方法

ArenaRL是高德地图与阿里通义团队联合开源的对比式强化学习方法，专为解决开放域任务（如出行规划）中缺乏标准答案的问题。核心创新在于用“相对排序”替代传统“绝对打分”机制，通过智能体自动生成多套方案...

Latest AI Resources

2mos ago

016.2K

Step-Audio-R1.1 - 阶跃星辰开源的全球首个原生语音推理模型

Step-Audio-R1.1是阶跃星辰开源的全球首个原生语音推理模型，最新升级版本在权威评测榜单Artificial Analysis Speech Reasoning中以96.4%准确率登顶。模型...

Latest AI Resources

2mos ago

027.5K

OctoCodingBench - MiniMax开源面向Coding Agent标准的评测集

OctoCodingBench是MiniMax开源的首个面向Coding Agent生产级标准的评测集，核心创新在于通过Check-level准确率(CSR)和Instance-level成功率(IS...

Latest AI Resources

2mos ago

018.1K

GLM-Image - 智谱联合华为开源的多模态图像生成模型

GLM-Image是智谱与华为联合开源的多模态图像生成模型，基于昇腾Atlas 800T A2芯片和昇思MindSpore框架训练，采用创新的"自回归+扩散解码器"混合架构。核心突破在于实现了国产芯片...

Latest AI Resources

2mos ago

020.7K

Baichuan-M3 - 百川智能开源的新一代医疗大语言模型

Baichuan-M3是百川智能推出的新一代开源医疗大语言模型，专为医疗场景深度优化，具备强大的医疗推理和问诊能力。在权威的HealthBench评测中以65.1分的综合成绩位列全球第一，超越了GPT...

Latest AI Resources

2mos ago

019.8K

女娲智能体OS - 西南财经开源的通用智能体操作系统

女娲智能体OS（Nuwax Agent OS）是西南财经大学赵宇教授团队推出的全球首个开源通用智能体操作系统。具备自主执行引擎，可实现从需求拆解到任务规划与执行的全链路自动化。系统支持可视化工作流编排...

Latest AI Resources

2mos ago

032.2K

Nemotron Speech ASR - 英伟达开源的实时语音识别模型

Nemotron Speech ASR是英伟达开源的实时语音识别模型，专为低延迟场景优化，支持24毫秒极速转录和多人并发对话。核心采用混合Mamba-Transformer MoE架构，通过固定状态缓...

Latest AI Resources

2mos ago

021.1K

Qwen3-VL-Reranker - 阿里巴巴推出的多模态重排序模型

Qwen3-VL-Reranker是阿里巴巴推出的多模态重排序模型，专门用于提升跨模态检索的精准度。与Qwen3-VL-Embedding协同工作：前者负责快速召回候选结果，后者通过深度跨模态交互（如...

Latest AI Resources

2mos ago

024.6K

Qwen3-VL-Embedding - 阿里通义团队开源的多模态嵌入模型

Qwen3-VL-Embedding是阿里通义团队开源的多模态嵌入模型，属于Qwen3-VL系列，主要用于跨模态检索任务。模型将文本、图像、视频等不同模态数据映射到同一语义空间，通过双塔架构生成向量表...

Latest AI Resources

2mos ago

026.7K

AntAngelMed - 蚂蚁联合浙江省卫生健康信息中心开源的医疗大模型

AntAngelMed（蚂蚁·安诊儿医疗大模型）是浙江省卫生健康信息中心、蚂蚁健康、浙江省安诊儿医学人工智能科技有限公司联合开发的开源医疗大模型。模型采用混合专家架构（MoE），总参数量达1000亿...

Latest AI Resources

2mos ago

029.8K

VoiceSculptor - 西北工业大学联合语图智能开源的音色设计模型

VoiceSculptor 是西北工业大学联合多家机构开源的音色设计模型，基于 LLaSA-3B 和 CosyVoice2 开发，专注于通过自然语言指令生成多样化音色的语音合成。支持对语速、音量、基频...

Latest AI Resources

2mos ago

022K

10Kh RealOmni-Open - 简智机器人开源的具身智能数据集

10Kh RealOmni-Open是简智机器人开源的具身智能数据集，是行业内规模最大的开源具身智能数据集。数据集累计拥有超10000小时数据、100万+片段，覆盖10大场景任务、超过30项技能。数据...

Latest AI Resources

2mos ago

026.1K

Youtu-LLM - 腾讯 Youtu 团队开源的轻量级语言模型

Youtu-LLM 是腾讯 Youtu 团队开源的轻量级语言模型，参数规模为 19.6 亿。专为智能体任务设计，具备强大的“原生智能体能力”，在多项任务中超越同规模甚至更大模型。

Latest AI Resources

2mos ago

022.3K

Genie Sim 3.0 - 智元机器人开源首个大语言模型驱动的仿真平台

Genie Sim 3.0是智元机器人发布的首个大语言模型驱动的开源仿真平台。基于NVIDIA Isaac Sim构建，融合三维重建、视觉生成技术与物理引擎，实现毫米级精准复刻真实环境，通过自然语言指...

Latest AI Resources

2mos ago

020.7K

LandPPT - 开源免费的AI PPT生成工具，支持本地部署和云端协作

LandPPT是基于大语言模型的开源AI PPT生成工具，支持通过主题或上传文档（PDF/Word/Excel）一键生成专业演示文稿。集成了多模型驱动、实时联网搜索和AI绘图功能，提供丰富的模板和场景...

Latest AI Resources

2mos ago

032.7K

TuriX-CUA - 开源AI桌面自动化工具，AI直接操作电脑桌面

TuriX-CUA 是开源的 AI 桌面自动化工具，能通过截屏、多模态模型决策和自动化操作实现电脑交互。让 AI 模型直接操作电脑桌面环境。支持 macOS 和 Windows 系统，通过先进的计算机...

Latest AI Resources

2mos ago

031.8K

MiroThinker 1.5 - MiroMind 团队开源的搜索智能体模型

MiroThinker 1.5 是 MiroMind 团队开源的搜索智能体模型，基于 Qwen3 系列开发，包含 30B 和 235B 两种参数规模版本。模型采用交互式扩展技术，支持 256K 上下文...

Latest AI Resources

2mos ago

038.5K

UltraEval-Audio - 清华、OpenBMB联合面壁智能开源的音频模型评测框架

UltraEval-Audio是清华大学NLP实验室、OpenBMB和面壁智能联合开发的音频模型评测框架，最新版本为v1.1.0。专注于解决音频模型复现难、依赖冲突等问题，提供一键复现热门模型（如Vo...

Latest AI Resources

2mos ago

024.3K

openPangu-VL-7B - 华为开源的7B参数多模态模型

openPangu-VL-7B是华为开源的7B参数规模的多模态模型，专为昇腾端侧设备优化设计。模型在视觉定位、OCR识别、文档理解等任务中表现出色，支持实时推理（5FPS），单卡延迟仅160毫秒。

Latest AI Resources

2mos ago

023.8K

New API - 开源的AI模型接口管理与分发系统，统一为标准化接口

New API是基于Go语言开发的开源AI聚合网关工具，可统一管理30+种主流大模型（如OpenAI、Claude、Midjourney等），将不同模型接口转换为标准化OpenAI格式。

Latest AI Resources

2mos ago

022.7K

Paper2Any - 北大DCAI团队开源的AI科研与演示文稿生成平台

Paper2Any是北京大学DCAI课题组开源的多模态辅助平台，专注于从论文PDF、图片和文本中快速生成多种科研内容。具备一键生成科研绘图的功能，能从多种输入源生成模型架构图、技术路线图和实验数据图等...

Latest AI Resources

2mos ago

031K

StoryMem - 字节跳动与南洋理工联合开源的AI视频生成系统

StoryMem是字节跳动与南洋理工大学联合开源的AI视频生成系统，专为解决多场景视频中角色和环境一致性问题。核心通过"视觉记忆库"技术，自动存储关键帧并在后续生成时参考，确保人物外貌、服装、场景元素...

Latest AI Resources

2mos ago

022.4K

XVERSE-Ent - 元象科技开源的泛娱乐领域中英大模型

XVERSE-Ent是元象科技推出的专注于泛娱乐领域的开源大模型，包含中英文双版本，支持社交互动、游戏叙事和文化创作等场景。模型通过角色一致性强化、长剧情理解等技术优化，能在虚拟角色人设稳定性、复杂故...

Latest AI Resources

2mos ago

025.9K

Vibe Kanban - 开源的免费AI编程代理任务管理工具

Vibe Kanban是开源的AI编程代理任务管理工具，专为同时使用多个AI编程助手（如Claude Code、Gemini CLI、Codex等）的开发者设计。通过看板形式统一管理任务进度，支持并行...

Latest AI Resources

2mos ago

025K

Chatterbox-Turbo - Resemble AI开源的文本到语音模型

Chatterbox-Turbo 是 Resemble AI 推出的开源文本到语音（TTS）模型，专为高效、低延迟的语音合成而设计。基于350M参数的精简架构，单步推理生成音频，时间延迟极低，在150...

Latest AI Resources

2mos ago

026.4K

IQuest-Coder-V1 - 至知创新研究院开源的代码大模型系列

IQuest-Coder-V1是九坤投资旗下至知创新研究院研发的开源代码大模型系列，专注于代码智能领域，具备自动编程、Bug修复和代码解释等能力。模型采用创新的Code-Flow训练范式，从代码库演化...

Latest AI Resources

2mos ago

032.6K

Mixed Motion 1.0 - Tencent Mixed Motion team open source text to generate 3D action models

Hybrid Motion1.0 (HY-Motion1.0) is Tencent Hybrid team open source text generated 3D action model , using 1 billion parameters Diffusion Transformer architecture , can be directly generated through natural language description of high-quality 3D character animation .

Latest AI Resources

2mos ago

031K

Yume1.5 - An Interactive World Generation Model Open-Sourced by Shanghai AI Lab and Fudan University

Yume 1.5 is an open source interactive world generation model, jointly developed by Shanghai Artificial Intelligence Laboratory, Fudan University, and Shanghai Innovation Research Institute, which is capable of real-time interactive rendering (12 FPS on a single card). It adopts the joint spatio-temporal channel modeling (TSCM) technology, even if the context length increases...

Latest AI Resources

2mos ago

025.3K

AutoMV - M-A-P open source free music video generation system in conjunction with the North Post, South University, etc.

AutoMV is an open source music video generation system developed by the M-A-P team in collaboration with several universities, which can automatically generate coherent music videos based on complete songs without training.It adopts a multi-intelligence body collaboration model, including music analysis, scriptwriting, directing, and quality control modules, and can accurately analyze the lyrics, beats, and...

Latest AI Resources

2mos ago

027.5K

Tencent-HY-MT1.5 - Tencent hybrid open source translation model series

Tencent-HY-MT1.5 is Tencent hybrid open source translation model version 1.5, including 1.8B and 7B two models, support for 33 international languages and 5 kinds of folk Chinese/dialect translation.1.8B model is specially optimized for cell phones and other consumer-grade devices, only 1GB of RAM can be achieved end-side...

Latest AI Resources

3mos ago

034.9K

PersonaLive - The University of Macau and other open source real-time AI portrait animation generation live framework

PersonaLive is an open source real-time AI face-swapping live streaming framework, jointly developed by the University of Macau, dzine.ai, and the GVC Lab at the University of the Greater Bay Area. It can realize low-latency and high frame rate digital person drive on ordinary consumer-grade graphics cards (12GB video memory), and support real-time through the camera...

Latest AI Resources

3mos ago

027.4K

Computer Use Preview - Google开源的AI浏览器自动化工具

Computer Use Preview - Google's open source AI browser automation tool

Computer Use Preview is Google's open source AI browser automation tool based on the Gemini model , through natural language commands to achieve web page interaction . Using "screenshot→analysis→execution" visual recognition process , support Playwrigh...

Latest AI Resources

3mos ago

023.5K

ClipSketch AI - Open source AI video to hand-drawn split-screen tool, support B station, small red book

ClipSketch AI is open source video to hand-drawn split-screen tool designed for short video creators. It can convert videos from B station, Little Red Book and other platforms into hand-drawn style storyboards with one click, support marking key frames, automatic generation of sub-scenes and social copy, and can integrate user-defined roles.

Latest AI Resources

3mos ago

028.2K

MAI-UI - Ali Tongyi Labs Open Source Universal GUI Intelligent Body Base Model

MAI-UI is an open source generalized GUI intelligent body base model from Alibaba Tongyi Labs, with four major capabilities: cross-application operation, fuzzy semantic understanding, active user interaction and multi-step process coordination. Adopting end-cloud collaboration architecture, the lightweight model resides in the device to handle daily tasks, and complex tasks can call the cloud big...

Latest AI Resources

3mos ago

032.1K

MiniMax M2.1 - MiniMax open source coding and agent modeling

MiniMax M2.1 is MiniMax's open source coding and agent model with 10 billion activations and support for many major programming languages such as Rust, Java, Golang, C++, Kotlin, Objective-C, TypeS...

Latest AI Resources

3mos ago

019.7K

InstanceAssemble - Little Red Book and Fudan University open source layout control generation technology

InstanceAssemble is a layout control generation technology jointly open-sourced by Little Red Book and Fudan University, which realizes accurate image generation from simple to complex and from sparse to dense layout through the mechanism of "Instance Assemble Attention". Adopting a two-stage cascade architecture, Mr. Mr. into the image background, and then one by one ...

Latest AI Resources

3mos ago

016.7K

Zen Browser - Open source AI web browser based on Firefox kernel

Zen Browser is an open source browser based on the Firefox kernel, focusing on a simple and efficient browsing experience, with the core features of vertical tab bar and workspace isolation. With the sidebar design, it can clearly display the full titles of 50+ tabs and supports multi-window split-screen browsing.

Latest AI Resources

3mos ago

027.6K

QwenLong-L1.5 - Ali Tongyi Labs open source long text inference model

QwenLong-L1.5 is an open source long text inference model from Alibaba Tongyi Lab, focusing on solving complex inference problems with ultra-long contexts (e.g., 1M-4M tokens). The core breakthrough lies in three major innovations in the post-training phase: through knowledge graph, SQL parsing and multi-intelligence...

Latest AI Resources

3mos ago

022.2K

Infographic - Ali AntV team open source infographic generation framework

Infographic is a new generation of Ali AntV team open source framework , based on G2 and Ant Design development , focusing on rapid generation of high-quality infographics , providing 30 + layout templates , 120 + preset themes and AI intelligent generation capabilities .

Latest AI Resources

3mos ago

023.7K

opcode - open source graphical desktop application designed for Claude Code

opcode is designed for Claude Code open source graphical desktop application , the developer winfunc based on Tauri 2 + React 18 + Rust development. Provides a visual interface to manage Claude Code projects , support for creating ...

Latest AI Resources

3mos ago

023.8K

TurboDiffusion - Raw Digital Technology, Tsinghua and other open source video generation acceleration framework

TurboDiffusion is a video generation acceleration framework jointly open-sourced by Tsinghua University, BioDigital Technology, and UC Berkeley, which is able to improve video generation speed by 100-200 times while maintaining nearly lossless picture quality. Through sparse linear attention, sample step distillation and 8-bit...

Latest AI Resources

3mos ago

026.5K