OctoCodingBench - MiniMax开源面向Coding Agent标准的评测集OctoCodingBench是MiniMax开源的首个面向Coding Agent生产级标准的评测集,核心创新在于通过Check-level准确率(CSR)和Instance-level成功率(IS...최신 AI 리소스4개월 전026.4K
MiniMax M2.1 - MiniMax 오픈 소스 코딩 및 에이전트 모델MiniMax M2.1은 100억 건의 활성화를 달성한 MiniMax의 오픈 소스 코딩 및 에이전트 모델이며 Rust, Java, Golang, C++, Kotlin, Objective-C, TypeS 등 여러 주요 프로그래밍 언어를 지원합니다....최신 AI 리소스4개월 전026.2K
ArenaRL - 高德地图联合阿里通义开源的对比式强化学习方法ArenaRL是高德地图与阿里通义团队联合开源的对比式强化学习方法,专为解决开放域任务(如出行规划)中缺乏标准答案的问题。核心创新在于用“相对排序”替代传统“绝对打分”机制,通过智能体自动生成多套方案...최신 AI 리소스3 개월 전024.8K
인스턴스어셈블 - 리틀 레드북과 푸단대학교 오픈 소스 레이아웃 제어 생성 기술인스턴스어셈블은 샤오홍슈와 푸단대학교가 공동으로 오픈소스화한 레이아웃 제어 생성 기술로, '인스턴스 어셈블 주의' 메커니즘을 통해 단순한 레이아웃에서 복잡한 레이아웃, 희박한 레이아웃에서 조밀한 레이아웃까지 정확한 이미지 생성을 달성합니다. 먼저 이미지 배경에 2단계 캐스케이드 아키텍처를 채택한 다음 하나씩 하나씩 ...최신 AI 리소스4개월 전023.8K
Gemini 3.1 Flash-Lite - Google推出的最轻量、最具性价比的模型Gemini 3.1 Flash-Lite 是 Google 发布的 Gemini 3 系列中最轻量、最具性价比的模型,主打极致速度与低成本。模型从 Gemini 3 Pro 蒸馏而来,输入价格仅 ...최신 AI 리소스2개월 전023.3K
小艺Claw - 华为推出的个人手机AI助理,一键接入OpenClaw小艺Claw是华为基于OpenClaw开源框架推出的AI智能体,集成于小艺App中。小艺Claw打破传统语音助手"被动应答"的交互逻辑,具备自主规划与任务执行能力,可独立完成办公文档处理、信息检索、服...최신 AI 리소스2개월 전022.6K
ArkClaw - 火山引擎推出的云端AI助手,零门槛部署OpenClawArkClaw是火山引擎推出的云端智能助手平台,基于OpenClaw架构构建,让用户无需繁琐配置可快速部署专属AI Agent。최신 AI 리소스2개월 전022.6K
MiroFish - 开源的AI预测引擎,智能体进行自由交互与社会演化MiroFish是中科大20岁学生BaiFu开源的AI预测引擎,基于多智能体技术,能从新闻、小说等种子信息自动构建高保真平行数字世界。최신 AI 리소스2개월 전021.8K
FireRed-OCR - 小红书团队开源的端到端文档解析模型FireRed-OCR 是小红书 Super Intelligence 团队开源的端到端文档解析模型,基于 Qwen3-VL-2B 架构打造,仅用 2B 参数就在 OmniDocBench v1.5 ...최신 AI 리소스2개월 전021.8K
OpenCLI - 开源 AI 命令行工具框架,任何网站变成命令行OpenCLI是开源的命令行工具框架,将网站、Electron应用和本地命令行工具统一转化为可通过命令行操作的接口,将网站(如B站、知乎、Twitter等)和Electron应用(如Cursor、No...최신 AI 리소스1개월 전021.8K
Mobile-Agent-v3.5 - 阿里通义开源的原生GUI Agent框架Mobile-Agent-v3.5是阿里巴巴通义实验室开源的新一代多平台GUI Agent框架,支持桌面、手机、浏览器三大平台,可跨Android、Ubuntu、macOS、Windows实现自动化操...최신 AI 리소스2개월 전021.7K
微信ClawBot - 微信官方推出连接 OpenClaw 的 AI 插件微信ClawBot是微信官方推出的AI插件,核心定位是连接OpenClaw(开源AI智能体框架)与微信的消息通道。用户只需在部署OpenClaw的设备上执行一条命令完成安装,可通过微信聊天界面直接发送...최신 AI 리소스1개월 전021.6K
肉包 - 开源AI手机自动化助手,能看懂屏幕自动执行肉包(Roubao)是开源的AI手机助手,让用户用现有Android手机能体验类似"豆包手机"的智能自动化功能。肉包基于视觉语言模型,能看懂屏幕内容并自动执行复杂任务,从点外卖、发微信到跨App操作...최신 AI 리소스1개월 전020.8K
HiClaw - 阿里云开源的多智能体团队协作系统HiClaw 是阿里云开源的多 Agent 协作框架,让单个用户能像指挥团队一样调度多个 AI 员工。系统设置一位 Manager 管家负责拆解任务、分配工作,各 Worker 专精不同领域且相互隔离...최신 AI 리소스1개월 전020.5K
Updream - 哔哩哔哩推出的自研AI视频创作工具Updream是哔哩哔哩推出的自研AI视频创作工具,目前采用定向邀请制内测。产品定位为UP主的"智能创意助手",通过AI技术打通创作全流程:从灵感生成、选题构思到智能剪辑、分镜处理,再到个性化技能库与...최신 AI 리소스4주 전020.5K
GLM-5-Turbo - 智谱 AI 推出专为 OpenClaw 场景深度优化的基座模型GLM-5-Turbo 是智谱 AI 发布的全球首款专为 OpenClaw(龙虾) 场景深度优化的基座模型,也是 GLM-5 系列的高速增强版本。模型从训练阶段就针对 Agent 任务的核心需求进行专...최신 AI 리소스1개월 전020.4K
YouClaw - Chat2DB 开源的极简 AI Agent 桌面客户端YouClaw 是 Chat2DB 团队推出的极简 AI Agent 桌面客户端,主打"最懂你的 AI 个人助理"定位。基于 Tauri 2 + React 构建,安装包仅约 30MB,支持 Wind...최신 AI 리소스1개월 전020.1K
NemoClaw - NVIDIA 推出的开源企业级 AI Agent 安全增强平台NemoClaw 是 NVIDIA 推出的开源企业级 AI Agent 安全增强平台。作为 OpenClaw 的"安全插件"和运行时沙箱层,通过 OpenShell 为自主 AI 代理添加企业级的隐私...최신 AI 리소스1개월 전019.9K
AlphaClaw - 熵简科技推出的金融投研 AI Agent 工具AlphaClaw 是熵简科技推出的金融投研 AI 工具,搭载于 AlphaEngine 平台,被誉为"投研小龙虾"。完成了从"有问必答的 AI 助手"向"自主执行的 AI 分析师"的进化,能独立跑通...최신 AI 리소스2개월 전019.4K
MiniMax M2.7 - MiniMax 推出的旗舰级 Agent 推理大模型MiniMax M2.7 是 MiniMax 推出的旗舰级 Agent 推理大模型,主打"模型自我进化"能力。模型通过构建 Agent Harness 体系,深度参与自身训练与优化流程,在部分研发场景...최신 AI 리소스1개월 전019.4K
Paperclip - 开源的AI Agent编排平台,管理和协调多个AI智能体Paperclip是开源的AI代理编排平台,定位为“零人工公司操作系统”,用于管理和协调多个AI代理(如OpenClaw、Claude Code等)协同工作。提供组织架构、目标对齐、预算控制、任务追踪...최신 AI 리소스2개월 전019.4K
NineClaw - 好未来推出的教师专属 AI 原生桌面超级智能体NineClaw(九章龙虾) 是好未来(TAL)推出的行业首款教师专属AI原生桌面超级智能体,昵称"九龙"。深度融合好未来20年教研积累与海量题库资源,采用本地化运行架构,支持Windows和MacO...최신 AI 리소스1개월 전019.2K
HY-WU - 腾讯混元开源的实时神经参数生成框架HY-WU(混元无相)是腾讯混元推出的功能性神经记忆框架,能在AI推理时即时创建个性化适配参数。框架为每个任务"临时定制"专属技能,无需重新训练模型。최신 AI 리소스2개월 전018.9K
MAI-Image-2 - 微软推出的第二代自研图像生成模型MAI-Image-2 是微软推出的第二代自研图像生成模型,模型在权威评测平台 LMArena 中跃升至全球第三位,仅次于谷歌和 OpenAI,标志着微软在图像生成领域实现从"追赶者"到"第一梯队"的...최신 AI 리소스1개월 전018.5K
DuClaw - 百度智能云推出的OpenClaw云部署服务DuClaw是百度智能云推出的托管式OpenClaw服务,专为无技术背景用户设计。DuClaw免除了服务器配置、镜像选择和API密钥管理的繁琐步骤,用户订阅后可在网页端直接调用完整的智能体功能。최신 AI 리소스2개월 전018.4K
Qwen3.6-Plus - 阿里通义推出的新一代原生多模态大模型Qwen3.6-Plus是阿里发布新一代大语言模型,是千问3.6系列的首款模型,定位为企业级Agentic AI编程利器。相比3.5版本,模型在编程能力、智能体Agent能力和多模态推理上实现全面跃升...최신 AI 리소스4주 전018.3K
SkyClaw - Skywork AI 推出的云端AI Agent工作空间SkyClaw 是 Skywork AI 推出的云端持久化智能工作空间,定位超越传统对话机器人的"主动执行型代理"。支持在 Slack、Discord、WhatsApp 等主流平台原生集成,能基于用户...최신 AI 리소스1개월 전018.2K
Gemini Embedding 2 - Google推出的首个原生五模态 Embedding 模型企业知识库管理员:需要统一检索文档、会议录音、培训视频、产品图片等多模态资料的企业用户 RAG 应用开发者:为多模态内容提供语义检索能力,提升生成质量的 AI 应用开发者 法律/医疗行业从业者:如 E...최신 AI 리소스2개월 전018.2K
Seedance 2.0 - 字节Seed团队推出的第二代多模态AI视频生成模型Seedance 2.0 是字节跳动(TikTok母公司)Seed团队开发的第二代多模态AI视频生成模型,代表了从单纯文本/图像转视频工具向专业级电影制作平台的重大升级,支持文本、图像、视频片段和音频...최신 AI 리소스1개월 전017.9K
gws - 谷歌开源的CLI工具,支持接入各类AI Agent系统gws 是 Google Workspace 团队推出的命令行工具,采用 Rust 构建。工具支持运行时动态生成命令,通过读取 Google Discovery Service 实时适配所有 Work...최신 AI 리소스2개월 전017.9K
移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent移动云 MobileClaw 是中国移动推出的桌面级AI办公智能体,央企首个深度兼容OpenClaw生态的"自研小龙虾",主打"本地优先、隐私至上"。采用一键安装开箱即用设计,适配Windows/ma...최신 AI 리소스1개월 전017.7K
Fun-CineForge - 阿里通义实验室开源的影视级配音多模态大模型Fun-CineForge 是阿里通义实验室开源的首个支持影视级多场景配音的多模态大模型,基于 CosyVoice3 打造。通过"数据+模型"一体化设计,创新性地解决音画同步、情感表达、音色一致与时间...최신 AI 리소스1개월 전017.5K
天工短剧工作台 - 天工AI推出的AI短剧工业化创作平台天工短剧工作台是昆仑万维天工AI团队推出的AI短剧工业化创作平台,主打"Agent驱动内容创作流程自动化"。平台整合Seedance、SkyReels、可灵、Vidu四大视频模型,通过资产提取、导演...최신 AI 리소스4주 전017.5K
GPT-5.4 mini - OpenAI 推出的轻量级 AI 模型GPT-5.4 mini 是 OpenAI 发布的轻量级模型,定位为"迄今能力最强的小型模型"。在保留 GPT-5.4 核心能力的同时,实现了速度提升 2 倍以上,成本大幅降低,专为对延迟敏感的高频工...최신 AI 리소스1개월 전017.3K
EdgeClaw - 面壁智能联合清华等开源的端云协同 AI 智能体框架EdgeClaw 是面壁智能联合清华大学等机构开源的端云协同 AI 智能体框架,主打安全可控与本地部署。首创三层数据安全协议(S1/S2/S3),通过规则检测器与本地 LLM 语义检测器实时分类请求敏...최신 AI 리소스1개월 전017.2K
Veo 3.1 Lite - Google DeepMind发布的低成本AI视频生成模型Veo 3.1 Lite是Google DeepMind发布的低成本AI视频生成模型,定位为Veo系列中最实惠的版本,专为大规模视频生成场景设计。模型支持文本和图像生成视频,输出720p和1080p分...최신 AI 리소스4주 전017.1K
Gemma 4 - 谷歌DeepMind发布的第四代开源大语言模型系列Gemma 4是谷歌DeepMind发布的第四代开源大语言模型系列,属于Gemma家族的最新版本。专为高级推理和智能体(agentic)工作流设计,为开发者提供高性能、低门槛的本地化AI解决方案,覆盖...최신 AI 리소스4주 전017K
MiMo-V2-TTS - 小米推出的自研语音合成大模型MiMo-V2-TTS是小米推出的自研语音合成大模型,与MiMo-V2-Pro、MiMo-V2-Omni共同构成小米面向"Agent时代"的三大基础模型矩阵。模型基于自研Audio Tokenizer...최신 AI 리소스1개월 전016.8K
Qwen3.5-Max-Preview - 阿里通义千问推出的旗舰大模型预览版Qwen3.5-Max-Preview 是阿里通义千问团队推出的旗舰大模型预览版,在 LM Arena 国际大模型竞技场以1464分跻身全球前五、国内第一,标志着国产大模型首次进入全球第一梯队。최신 AI 리소스1개월 전016.5K
GLM-5.1 - 智谱AI推出的744B参数开源旗舰模型GLM-5.1是智谱AI推出的744B参数开源旗舰模型,采用MIT许可可自由商用,上下文窗口达20万token,专为长程智能体工程设计,支持单任务连续自主执行8小时、完成1700+步骤的复杂工作流。在...최신 AI 리소스3주 전016.5K
MiniMax Music 2.5+ - MiniMax推出的AI音乐生成模型MiniMax Music 2.5+是MiniMax推出的AI音乐生成模型,专注器乐创作。模型精通古典管弦、电子氛围、自然声景等多元风格,擅长将东方传统乐器与西方现代编曲融合,实现跨风格创新。최신 AI 리소스1개월 전016.4K
Xiaomi MiMo-V2-Pro - 小米推出的旗舰级MoE大模型Xiaomi MiMo-V2-Pro 是小米推出的旗舰级MoE大模型,采用1万亿总参数、420亿激活参数的混合专家架构,支持最高100万token超长上下文。模型以代号"Hunter Alpha"匿名...최신 AI 리소스1개월 전016K
Mistral Small 4 - Mistral AI 开源的多模态大模型Mistral Small 4 是 Mistral AI 开源的多模态大模型,采用 1190 亿参数 MoE 架构(每 token 激活 60 亿参数),支持 256K 超长上下文。核心突破在于三合一...최신 AI 리소스1개월 전015.9K
ClawHub中国镜像站 - OpenClaw官方推出的技能市场本地化站点ClawHub中国镜像站是OpenClaw官方推出的技能市场本地化站点,是字节跳动BytePlus及火山引擎提供基础设施支持。镜像站专为解决国内开发者访问原站速度慢、API受限等痛点而设,提供完整中文...최신 AI 리소스3주 전015.9K
Xiaomi MiMo-V2-Omni - 小米推出的Agent全模态基座模型Xiaomi MiMo-V2-Omni 是小米推出的面向Agent时代的全模态基座模型,专为现实世界中复杂的多模态交互与执行场景打造。模型从底层构建了融合文本、视觉、语音的统一架构,将"感知"与"行动...최신 AI 리소스1개월 전015.6K
TuyaClaw - 涂鸦智能推出的数字与物理世界联动 AI AgentTuyaClaw 是涂鸦智能(Tuya Smart)推出的 AI 助理,基于 OpenClaw 架构搭建,是全球首个同时打通数字世界与物理世界的 AI Agent。与市面上仅能在屏幕内执行任务的"龙虾...최신 AI 리소스1개월 전015.6K
Wan2.7-Video - 阿里通义实验室推出的新一代 AI 视频生成模型系列Wan2.7-Video 是阿里通义实验室推出的新一代 AI 视频生成模型系列,由文生视频(Wan2.7-t2v)、图生视频(Wan2.7-i2v)、参考生视频(Wan2.7-r2v)和视频编辑(Wa...최신 AI 리소스3주 전015.3K
Vidu Claw - Vidu AI 推出的 AI 视频创意AgentVidu Claw(代号"V龙")是生数科技旗下 Vidu AI 平台推出的 AI 创意智能体,定位为"你的第一个 AI 创意员工"。基于 Vidu 视频大模型构建,能自动完成从创意理解、脚本撰写、分...최신 AI 리소스1개월 전015.3K
Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型Qwen3.5-Omni是阿里通义推出的新一代全模态大模型,支持文本、图片、音频、音视频的原生理解与生成。采用Hybrid-Attention MoE架构,支持256K超长上下文,可处理10小时音频或...최신 AI 리소스1개월 전015.1K
PrismAudio - 阿里通义实验室开源的视频生成音频框架PrismAudio 是阿里通义实验室推出的视频生成音频框架,专注于为视频自动匹配严丝合缝的环境音效。框架创新性地引入"分解式思维链"(CoT)机制,让模型在生成音频前先分析视频内容、声音时序、音质特...최신 AI 리소스1개월 전015K
LongCat-AudioDiT - 美团开源的新一代高保真文本转语音模型LongCat-AudioDiT 是美团 LongCat 团队开源的新一代高保真文本转语音模型,采用 Wav-VAE 结合 Diffusion Transformer(DiT)的端到端架构,直接在波形...최신 AI 리소스4주 전015K
Wan2.7-Image - 阿里通义实验室推出的图像生成与编辑统一模型Wan2.7-Image 是阿里巴巴通义实验室发布的图像生成与编辑统一模型,定位为"全场景视觉创作旗舰"。模型直击AI生图领域"标准脸"审美疲劳和"色彩盲盒"痛点,采用生成与理解统一的底层架构,具备文...최신 AI 리소스4주 전014.8K
Fun-AudioGen-VD - 阿里通义实验室推出的声音设计系统Fun-AudioGen-VD 是阿里通义实验室推出的创新语音大模型,专注于声音设计与场景化音频生成。模型支持通过自然语言指令直接生成包含特定音色、情绪表达和完整听觉场景的高质量音频,无需参考音频即可...최신 AI 리소스2개월 전014.7K
GPT‑5.4 - OpenAI推出的全能旗舰AI模型GPT-5.4是OpenAI推出的旗舰AI模型,专为复杂专业场景设计。模型突破性融合推理、编程、原生计算机操控与深度搜索四大能力,在OSWorld测试中首次超越人类操作水平,知识工作任务表现达专家级标...최신 AI 리소스2개월 전014.7K
TypeNo - 开源 AI 语音输入工具,专为 macOS 设计TypeNo 是 marswaveai 团队开源的中文语音输入工具,专为 macOS 打造。用户只需轻点 Control 键即可录音,松手后语音会在本地实时转为文字并自动填入当前应用。최신 AI 리소스1개월 전014.6K
小精龙 - 学而思推出的原生学生端精准学智能体小精龙是学而思基于OpenClaw架构打造的原生学生端精准学智能体,以"大脑映射、私有财产、学习伴侣"为核心定位。首次将长期记忆、动态学情诊断、教育专属Skill链与情感陪伴系统整合为统一的学生专属A...최신 AI 리소스4주 전014.5K
GPT-5.3 Instant - OpenAI推出的GPT-5系列快速响应版本模型GPT-5.3 Instant 是 OpenAI 发布的 ChatGPT 主力模型升级版,主打"体验优化"而非参数堆叠。精准解决了用户长期诟病的"说教感"和机械回复问题,对话语气更自然直接,大幅减少了...최신 AI 리소스2개월 전014.4K
HiDreamClaw - 智象未来推出的多模态原生AI智能体应用HiDreamClaw 是智象未来(HiDream.ai)推出的多模态原生AI智能体应用,定位为图片与视频生成垂直领域的创作助手。目前已接入其海外平台vivago,面向创作者提供7×24小时在线服务。최신 AI 리소스1개월 전014.2K
Fun-CosyVoice3.5 - 阿里通义实验室推出的第三代语音合成大模型Fun-CosyVoice3.5是阿里通义实验室推出的第三代语音合成大模型,主打"自然语言指令控制"能力,用户可直接用口语化描述(如"语气坚定一点""语速慢一点")来调节合成语音的情绪、语速和风格,无...최신 AI 리소스2개월 전014.2K
PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型PixVerse V6是爱诗科技推出的最新一代AI视频生成模型。在保持秒级生成速度的同时,重点优化了人物真实感、复杂运动表现、物理模拟及声画协同能力,支持最长15秒1080P视频生成。최신 AI 리소스1개월 전014.1K
GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型GLM-5V-Turbo是智谱发布首个原生多模态Coding基座模型,专为视觉编程打造。模型从预训练阶段深度融合视觉与文本能力,能直接理解设计稿、网页截图、K线图表等视觉信息并生成可运行代码,实现"所...최신 AI 리소스4주 전014.1K
Matrix-Game 3.0 - 昆仑万维发布的实时交互式世界模型Matrix-Game 3.0是昆仑万维发布的实时交互式世界模型,属于AIGC全家桶中的三大核心模型之一。模型通过物理仿真驱动,解决了传统世界模型易失忆、环境不稳定的问题,支持720p、40fps实时...최신 AI 리소스4주 전014K
Gemini 3.1 Flash Live - Google 推出的旗舰级实时语音模型Gemini 3.1 Flash Live 是 Google 推出的旗舰级实时语音模型,被誉为"迄今最高质量的音频和语音模型"。主打超低延迟的自然对话体验,支持 90+ 种语言的原生多模态交互,能精准...최신 AI 리소스1개월 전013.9K
ColaMD - 专为 AI Agent 时代设计的开源 Markdown 编辑器ColaMD 是专为 AI Agent 时代设计的开源 Markdown 编辑器,采用 MIT 协议开源,支持 macOS、Windows 和 Linux 三大平台。解决了传统编辑器(如 Typora...최신 AI 리소스4주 전013.7K
Octo - 即梦AI推出的首个协作型AI叙事创作工具Octo(小章鱼)是即梦AI推出的首个协作型AI叙事创作工具,首次提出VibeCreate创作模式,将人机协作编程范式迁移到创意内容领域,让AI从"指令执行者"转变为"创意合伙人"。최신 AI 리소스3주 전013.7K
商汤输入法AudioClaw - 商汤科技推出的AI语音智能助手商汤输入法AudioClaw是商汤科技基于日日新多模态大模型打造的AI语音智能应用,深度接入OpenClaw底层能力,定位为"会听话的龙虾"智能助手。최신 AI 리소스1개월 전013.7K
MMX-CLI - MiniMax 推出面向 AI Agent 的全模态命令行工具MMX-CLI 是 MiniMax(稀宇科技)发布的面向 AI Agent 的全模态命令行工具。支持在 Claude Code、OpenClaw 等环境中原生调用 MiniMax 的编程、视频生成、语...최신 AI 리소스3주 전013.6K
HappyHorse-1.0 - 阿里ATH创新事业部开源的AI视频生成模型HappyHorse-1.0(欢乐马)是阿里ATH创新事业部发布的开源AI视频生成模型,以150亿参数、40层单流Transformer架构实现原生音视频同步生成。模型在Artificial Anal...최신 AI 리소스3주 전013.5K
LongCat-Next - 美团龙猫开源的原生多模态大模型LongCat-Next 是美团龙猫开源的原生多模态大模型,采用"下一个Token预测"(NTP)统一架构,将图像、语音与文本映射为同源离散Token,打破传统"语言为中心"的拼凑式设计。核心创新包括...최신 AI 리소스1개월 전013.5K
OmniVoice - 小米开源的大规模多语言零样本TTS模型OmniVoice是小米开源的大规模多语言零样本TTS模型,支持600+种语言(含大量低资源语言),采用单阶段扩散语言模型架构直接映射文本至声学特征,基于58.1万小时数据训练。实现零样本语音克隆(仅...최신 AI 리소스3주 전013.4K
MiniMax Music 2.6 - MiniMax 发布的新一代AI音乐生成模型MiniMax Music 2.6是MiniMax发布的新一代AI音乐生成模型,主打20秒极速出歌和创新的cover翻唱功能。模型通过优化底层架构将生成延迟压缩至20秒内,新增国风音乐细节还原、乐器时...최신 AI 리소스3주 전013.4K
LPM 1.0 - 蔡浩宇 AI 公司 Anuttacon 推出的视频角色表演生成模型LPM 1.0(Large Performance Model)是米哈游创始人蔡浩宇创立的AI公司Anuttacon发布的首个视频角色表演生成模型,采用17亿参数扩散Transformer架构,专注于...최신 AI 리소스2 주 전013.3K
HY-World 2.0 - 腾讯混元开源的多模态世界模型HY-World 2.0(混元3D世界模型2.0)是腾讯混元开源的多模态世界模型,能理解文字、图片、视频等不同类型输入,自动生成、重建和模拟包含人、物、景的完整3D世界。최신 AI 리소스2 주 전013.2K
SciClaw - 面向科研人员的云端 AI Agent 协同系统SciClaw(科研龙虾) 是面向科研人员的云端 AI 协同系统,定位为"科研人的深夜搭子"。能深度分析文献、自主执行实验、自动排版生成论文/PPT/海报,记住用户电脑里的所有研究资料,将灵感、执行与...최신 AI 리소스1개월 전013.2K
SenseAudio - 商汤科技推出的一站式 AI 语音开放平台SenseAudio 是商汤科技推出的AI语音开放平台,面向开发者与企业提供一站式语音AI解决方案。平台集成语音识别(ASR)、语音合成(TTS)、音色克隆等核心能力,语音识别覆盖20+语言并支持说话...최신 AI 리소스1개월 전012.9K
Pascal Editor- 开源 AI 3D 建筑设计与可视化工具,网页端直接使用Pascal Editor 是基于浏览器的3D建筑设计与可视化工具,专为建筑师、设计师和开发者打造,支持在网页端直接进行楼层规划、空间布局和建筑场景探索。采用现代Web技术栈(React Three ...최신 AI 리소스1개월 전012.8K
Composer 2 - Cursor 推出的专有代码大模型Composer 2 是 AI 编程平台 Cursor 推出的专有代码大模型,主打"长周期智能体编程"。模型支持 20 万 Token 上下文窗口,能自主处理包含数百个操作的复杂开发任务,在 Term...최신 AI 리소스1개월 전012.6K
Lightpanda - 专为 AI 时代设计的开源无头浏览器Lightpanda是Lightpanda.io公司开发的开源无头浏览器,专为AI自动化和Web抓取设计。采用Zig语言从零构建,去除了图形渲染等冗余功能,核心优势是速度比Chrome快11倍,内存占...최신 AI 리소스4주 전012.5K
Nemotron 3 Super - NVIDIA开源的大语言模型,专为AI Agent推理设计Nemotron 3 Super是NVIDIA 发布的Nemotron 3 系列中目前最强大的开源权重 AI 模型。模型采用 1200 亿参数的混合专家(MoE)架构,推理时仅激活 120 亿参数,实...최신 AI 리소스2개월 전012.4K
ListenHub CLI - MarsWave AI推出的一站式内容引擎命令行工具ListenHub CLI 是MarsWave AI推出的面向开发者和 AI Agent 生态的一站式内容引擎命令行工具,基于 Node.js 开发,采用 MIT 协议开源。开发者通过 npm ins...최신 AI 리소스3주 전012.2K
TurboQuant - Google Research 推出的突破性内存压缩算法TurboQuant 是 Google Research 推出的突破性内存压缩算法,专为解决大语言模型推理中的 KV 缓存瓶颈而设计。최신 AI 리소스1개월 전012.1K
MaxHermes - MiniMax推出的全球首个云端自我进化AI助手MaxHermes是MiniMax推出的全球首个云端自我进化AI助手,基于开源框架Hermes Agent构建。核心特点是通过"学习闭环"机制自动提炼任务Skills并持续优化,无需人工预设,能力随使...최신 AI 리소스2 주 전012.1K
Claude Opus 4.7 - Anthropic 发布的最新旗舰AI模型Claude Opus 4.7是Anthropic发布的最新旗舰AI模型,作为Opus 4.6的升级版本,在保持原有定价的基础上实现全面性能跃升。模型专为复杂、长时间自主任务优化,在SWE-bench...최신 AI 리소스2 주 전011.9K
GPT-Image-2 - OpenAI 发布的下一代图像生成模型GPT-Image-2( ChatGPT Images 2.0)是 OpenAI 发布的下一代图像生成模型,代表了 AI 生图领域的重大飞跃。模型支持最高 4K 分辨率输出,革命性地解决了多语言文本渲...최신 AI 리소스1주일 전011.8K
Claude Managed Agents - Anthropic 推出的 Agent 操作系统Claude Managed Agents 是 Anthropic 官方推出的 Agent 操作系统,通过解耦 Brain(模型决策)、Hands(执行环境)与 Session(状态持久化)三大核心组...최신 AI 리소스3주 전011.8K
Lyria 3 Pro - 谷歌推出的最先进AI音乐生成模型Lyria 3 Pro是谷歌推出的最先进的AI音乐生成模型。相比前代Lyria 3仅30秒的生成时长,Pro版本可一次性生成长达3分钟的完整音轨,精准控制前奏、主歌、副歌、桥段等歌曲结构。최신 AI 리소스1개월 전011.8K
DeepSeek-V4 - 深度求索发布的新一代模型系列预览版DeepSeek-V4 是深度求索发布的模型系列预览版,已同步开源并开放 API。系列采用 MoE 架构,包含 V4-Pro(1.6T 参数 / 49B 激活)与 V4-Flash(284B 参数 ...최신 AI 리소스6일 전011.7K
ERNIE-Image - 百度文心大模型开源的文本生成图像模型ERNIE-Image 是百度文心大模型开源的文本生成图像模型,采用单流 Diffusion Transformer 架构,仅 80 亿参数即可在消费级显卡(RTX 4090,24GB 显存)上流畅运...최신 AI 리소스2 주 전011.6K
OmniWeaving - 浙大、腾讯混元联合南洋理工开源的统一视频生成模型OmniWeaving是浙江大学、腾讯混元与南洋理工大学联合发布的开源统一视频生成模型,模型采用MLLM(Qwen2.5-VL)+ MMDiT + VAE三层架构,通过激活多模态大模型的"思考模式"进...최신 AI 리소스3주 전011.5K
VimRAG - 阿里通义实验室开源的多模态检索增强生成框架VimRAG是阿里巴巴通义实验室开源的多模态检索增强生成框架,专门攻克文本、图像与视频混合场景下的长上下文推理难题。框架创新性地引入多模态记忆图将推理轨迹建模为动态DAG结构,实现显式状态追踪최신 AI 리소스3주 전011.5K
HappyOyster - 阿里巴巴ATH事业群发布的开放式世界模型产品HappyOyster是阿里巴巴ATH事业群发布的开放式世界模型产品,产品与谷歌Genie 3同属"世界模拟器"流派,采用长时间跨度的世界演化建模方式,主动理解空间、物理与因果规律,实现从"被动生成内...최신 AI 리소스2 주 전011.4K
Seeduplex - 字节跳动Seed团队发布原生全双工语音大模型Seeduplex是字节跳动Seed团队发布原生全双工语音大模型,已全量上线豆包App。区别于传统"听完再说"的半双工模式,Seeduplex实现真正的"边听边说",支持实时打断与多轮对话。采用端到端...최신 AI 리소스3주 전011.4K
PixVerse C1 - 爱诗科技推出全球首个面向影视行业的专业视频大模型PixVerse C1是爱诗科技推出的全球首个面向影视行业的专业视频大模型,专为短剧、动漫与漫剧创作打造。模型支持15秒1080P高清视频生成,具备原生音画同步能力,出片即自带音效,告别后期配音。최신 AI 리소스3주 전011.4K
Marble 1.1 - 李飞飞 World Labs 发布的生成式3D世界模型系列Marble 1.1 是李飞飞创立的 World Labs 公司发布的生成式3D世界模型最新版本系列,包含 Marble 1.1 和 Marble 1.1-Plus 两款模型,在视觉质量、场景规模和生...최신 AI 리소스2 주 전011.3K
MAI-Transcribe-1 - 微软AI团队推出的自研多语言语音识别模型MAI-Transcribe-1是微软AI团队推出的首款自研多语言语音识别模型,作为MAI模型家族的新成员,在FLEURS基准测试中实现了约3.9%的词错误率,显著超越OpenAI Whisper-l...최신 AI 리소스3주 전011.3K
VoxCPM2 - 面壁智能开源的 20 亿参数语音合成基座模型VoxCPM2 是 OpenBMB(面壁智能)开源的 20 亿参数语音合成基座模型,采用创新的无分词器扩散自回归架构,直接在连续语音潜空间生成音频,实现更自然的合成效果。模型基于 200 万小时多语言...최신 AI 리소스2 주 전010.9K
MAI-Image-2-Efficient - 微软AI团队推出的生产级文生图模型MAI-Image-2-Efficient是微软AI团队推出的生产级文生图模型,作为MAI-Image-2的"高效版",在保持接近旗舰版图像质量的同时,实现了速度提升22%、GPU效率提升4倍、成本降...최신 AI 리소스2 주 전010.9K
CutClaw - 北交大联合湾大开源的多智能体长视频编辑框架CutClaw 是开源的自主多智能体长视频编辑框架,由北京交通大学、大湾区大学与腾讯 ARC Lab 联合研发。通过"自底向上多模态解构"技术,将数小时原始素材结构化,采用 Playwriter(编剧...최신 AI 리소스2 주 전010.9K
Voxtral TTS - Mistral AI推出的开源文本转语音模型Voxtral TTSoxtral TTS是法国AI公司Mistral AI发布的开源文本转语音模型,采用40亿参数轻量化架构,量化后仅需3GB内存即可在智能手机等边缘设备实时运行。模型原生支持英语...최신 AI 리소스1개월 전010.8K