V-JEPA 2 - Meta AI 推出的最强世界大模型V-JEPA 2 是 Meta AI 推出的基于视频数据的世界大模型,拥有 12 亿参数。模型基于自监督学习从超过 100 万小时的视频和 100 万张图像中训练而成,能理解物理世界中的物体、动作和运...最新AI资源9个月前042.9K
UnifoLM-WMA-0 - 宇树科技开源的世界模型动作架构UnifoLM-WMA-0 是宇树科技开源的跨多类机器人本体的开源世界模型-动作架构,专为通用机器人学习而设计。由世界模型和动作架构组成,世界模型能理解机器人与环境的交互物理规律,动作架构则负责具体的...最新AI资源6个月前042.9K
FastDeploy - 百度推出的高性能大模型推理与部署工具FastDeploy 是百度推出的高性能推理与部署工具,专为大语言模型(LLMs)和视觉语言模型(VLMs)设计。FastDeploy 基于飞桨(PaddlePaddle)框架开发,支持多种硬件平台...最新AI资源7个月前042.9K
Doppl - 谷歌推出的AI虚拟试衣应用Doppl是谷歌推出的AI虚拟试衣应用。用户上传全身照片后,应用支持将服装图片或截图“穿”在数字版自己身上,且能将静态图片转换为AI生成的视频,让用户更真切地感受服装上身效果。最新AI资源9个月前042.9K
JoyHallo - 京东开源的AI数字人模型JoyHallo是京东开源的AI数字人模型,专为普通话设计,支持将音频转化为逼真的说话视频。JoyHallo基于wav2vec2模型嵌入音频特征,用半解耦结构,提升唇部运动预测准确性,支持生成英语视频...最新AI资源9个月前042.8K
Qwen-Flash - 通义千问推出的高性能、低成本语言模型Qwen-Flash 是阿里巴巴通义千问系列推出的高性能、低成本的语言模型,专为快速响应和高效处理简单任务设计。基于先进的 Mixture-of-Experts (MoE) 架构,通过稀疏专家网络实现...最新AI资源7个月前042.8K
商汤商量:日日新(SenseNova)超千亿参数模型,商量智能助手综合介绍 商汤商量是商汤科技研发的超千亿参数AI语言大模型平台,被称为SenseChat。该平台基于商汤强大的MaaS(Model as a Service)服务与算力支持,为用户提供多种人工智能内容...最新AI资源# AI大模型原生对话工具1年前042.8K
JustCMS:AI驱动的无头内容管理系统,利用 AI 快速创作内容(付费)综合介绍 JustCMS 是一个创新的内容管理系统,专为忙碌的内容创作者设计。它利用人工智能技术,从内容创意到发布的每一步都提供支持。JustCMS 采用无头架构,确保内容交付的速度和灵活性。用户可以...最新AI资源# AI写作1年前042.7K
幕布 - AI大纲笔记工具,复杂信息一键生成思维导图幕布是AI大纲笔记工具,帮助用户将零散的知识点基于结构化大纲形式系统化,工具支持一键生成思维导图。幕布支持将复杂信息以直观图形呈现,助力快速理清思路,提升理解和记忆效率。最新AI资源9个月前042.7K
无问芯穹:企业级AI开发,云端资源服务平台综合介绍 无问芯穹是一个面向AI开发者的综合服务平台,提供能力强大的AI开发工具与大模型服务。该平台具有AIStudio, GenStudio等多种机器学习开发工具,同时还支持模型部署、数据存储和模型...最新AI资源# AI开放服务1年前042.7K
VoxCPM - 面壁智能联合清华开源的端到端TTS模型VoxCPM 是面壁智能与清华大学深圳国际研究生院联合开源的语音生成模型。VoxCPM 采用端到端的扩散自回归架构,直接从文本生成连续语音表示,突破了传统离散分词的局限。通过分层语言建模和有限状态量化...最新AI资源6个月前042.7K
NeverEnds:使用文字描述生成效果逼真的视频综合介绍 NeverEnds是一个来自新加坡的平台,通过先进的模型将文字转换成视频,为各类故事提供了一个无限的创作空间。用户可以在这个平台上自由表达创意,传达情感,以及建设自己的品牌形象。这个平台以独...最新AI资源# AI图像转视频# AI文本转视频2年前042.7K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台Genie Envisioner(GE)是智元机器人团队联合新加坡国立大学、北京航空航天大学等机构开发的机器人操作统一平台。通过“先想象,后行动”的方式,让机器人更好地理解和执行任务。最新AI资源7个月前042.6K
探饭 - 字节跳动推出的AI美食推荐工具探饭是字节跳动旗下抖音推出的AI美食推荐工具,依托豆包大模型,为用户提供个性化美食推荐、探店对比、美食攻略等服务。探饭能根据用户口味偏好和位置,精准推荐附近餐厅和菜品,支持辅助点菜,提供团购和外卖服务...最新AI资源9个月前042.6K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型Seed GR-3 是字节跳动推出的通用机器人模型,具有强大的泛化能力,能适应新环境和复杂指令。模型融合视觉、语言和动作信息,基于机器人数据、VR 人类轨迹数据和公开图文数据的三合一训练法,提升对新物...最新AI资源8个月前042.6K
MiDashengLM - 小米开源的声音理解模型MiDashengLM 是小米开源的高效声音理解大模型,具体参数版本为MiDashengLM-7B ,专注于音频处理与理解。模型基于 Xiaomi Dasheng 音频编码器和 Qwen2.5-Omn...最新AI资源7个月前042.5K
Squibler - AI小说辅助写作平台,助力构思到创作全过程Squibler 是强大的 AI 辅助写作平台,专为作家设计,能帮助用户从构思到创作再到出版的全过程。平台提供多种故事模板,涵盖小说、剧本、短篇故事等,用户只需输入初始概念,AI 能生成大纲、角色、场...最新AI资源7个月前042.5K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版DeepSeek-R1是杭州深度求索公司DeepSeek推出的高性能AI推理模型,对标OpenAI的o1正式版。模型基于大规模强化学习技术进行后训练,仅需极少量标注数据,便能在数学、代码和自然语言推理...最新AI资源10个月前042.5K
Hailuo 02 - MiniMax推出的AI视频生成模型,性能超越可灵和Veo 3Hailuo 02 是 MiniMax 公司推出的全新 AI 视频生成模型,是 Hailuo 01 的升级版本。模型在图生视频和文生视频领域表现出色,排名仅次于字节的 Seedance 1.0,超越快...最新AI资源9个月前042.5K
Tizzy.ai - 百度推出的AI搜索应用Tizzy.ai 是百度推出的 AI 智能搜索应用。Tizzy.ai 基于百度的大模型技术,具备强大的智能搜索功能,能快速回答问题、深度思考和辅助决策。Tizzy.ai 界面简洁,无广告和弹窗,底部导...最新AI资源8个月前042.5K
MuseSteamer - 百度推出的视频生成大模型MuseSteamer是百度推出的多模态视频生成大模型。模型能根据用户提供的文字描述或图片,快速生成高质量的动态视频内容,支持多种清晰度和功能版本,满足不同场景下的创作需求。最新AI资源9个月前042.5K
MiniMax-M1 - MiniMax推出的开源推理模型MiniMax-M1 是 MiniMax 团队推出的开源推理模型,基于混合专家架构(MoE)与闪电注意力机制(Lightning Attention)相结合,总参数量达 4560 亿。模型支持 100...最新AI资源9个月前042.5K
Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型Wan2.2-S2V 是阿里通义开源的多模态视频生成模型,只需一张静态图片和一段音频,能生成高质量的数字人视频,且支持多种图片类型和画幅。最新AI资源7个月前042.5K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架OmniTalker是阿里巴巴推出的实时文本驱动的说话头像生成框架。框架能同时处理文本、图像、音频和视频等多种模态输入,基于流式方式生成自然语音响应。核心基于Thinker-Talker架构,Thin...最新AI资源9个月前042.5K
Foudinge Scrub:从餐厅评论中构建知识图谱综合介绍 Foudinge Scrub 是一个开源的网页工具,托管在 GitHub 上,由开发者 Théophile Cantelobre 创建。它旨在帮助用户清理和编辑从复杂文本数据中提取的知识图谱...最新AI资源# AI开源项目1年前042.4K
宠TA - 京东推出的AI宠物互动产品宠TA是京东推出的AIGC宠物互动产品,能为宠物爱好者提供充满乐趣和温馨的在线互动平台。支持用户为自己的宠物选择各种可爱的服装和配饰,进行个性化装扮,且能创建宠物的数字形象,与之进行丰富互动。平台提供...最新AI资源8个月前042.4K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型Skywork UniPic 2.0 是昆仑万维开源的高效多模态模型,专注于图像生成、编辑与理解。模型基于 2B 参数的 SD3.5-Medium 架构,通过预训练、渐进式双任务强化策略和联合训练,实...最新AI资源7个月前042.4K
ChatFlow - 开源AI工作流自动化工具ChatFlow 是开源的 AI 工作流自动化工具,支持将复杂的需求转化为高效的工作流程。工具基于 AI 技术,帮助用户快速生成代码框架、测试用例,能辅助写作和设计软件架构。最新AI资源8个月前042.4K
Make - AI无代码自动化工作流搭建平台Make是AI驱动的无代码自动化平台,帮助企业基于自动化流程提升效率和创新能力。平台提供超过2000个预建应用,支持多种业务场景,如营销、销售、财务等。Make的核心功能包括无代码可视化流程创建、AI...最新AI资源9个月前042.3K
MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型MinerU2.5是上海人工智能实验室与北京大学团队联合研发的解耦式视觉语言模型,专注于高效处理高分辨率文档图像解析。核心创新在于采用"先全局版面检测后局部内容识别"的两阶段设计:第一阶段通过低分辨率...最新AI资源5个月前042.3K
ROMA - 开源的元Agent框架,自动分解复杂任务并行处理ROMA(Recursive-Open-Meta-Agent)是Sentient AGI开发的开源元代理框架,通过递归任务分解和并行处理来高效解决复杂问题。支持Python 3.12+、Docker和...最新AI资源6个月前042.2K
Muzaic - AI音乐生成平台,一键生成与视频内容匹配的音乐Muzaic 是 AI 驱动的在线音乐生成平台,专为视频制作人和内容创作者设计。Muzaic支持基于 AI 技术快速生成与视频内容匹配的定制音乐,仅需 8 秒生成一分钟的录音室级别音轨。最新AI资源9个月前042.2K
觅果·Migo - AI学术研究助手,智能问答满足多样化需求觅果·Migo是AI驱动的学习与研究创新平台,具备强大的多模态AI能力,支持文本、语言、视觉和数据处理,能满足跨学科的多样化需求。觅果·Migo提供智能问答、网页辅读、文献阅读、学术写作、论文阅读、化...最新AI资源9个月前042.2K
EXAONE 4.0 - LG推出的混合推理模型EXAONE 4.0是韩国LG AI Research推出的混合推理大模型,融合通用自然语言处理和高级推理能力。模型支持韩语、英语和西班牙语,分为32B的专业版和1.2B的端侧版。专业版适用法律、会计...最新AI资源8个月前042.2K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架RoboOS 2.0 是智谱开源的跨本体大小脑协同框架,推动机器人从单一智能向群体协作智能转变。框架用“大小脑”架构实现高效分工,云端大脑负责复杂决策与协同,小脑模块专注于执行具体技能。最新AI资源8个月前042.2K
ChartAI - AI数据分析工具,智能推荐适合的图表类型ChartAI 是高效的数据可视化工具,基于 AI 技术自动分析数据,生成直观的图表,帮助用户快速理解复杂信息。ChartAI支持多种数据格式(如 Excel、CSV)的导入,支持智能推荐最适合的图表...最新AI资源9个月前042.2K
Hyperbolic AgentKit:让Agents拥有自己的计算资源,能够自主管理 GPU、执行区块链操作和社交发布综合介绍 Hyperbolic AgentKit是一个开源项目,旨在提供一个运行AI代理的模板,结合了区块链和计算能力。该项目基于Coinbase的CDP Agentkit进行修改和扩展,支持在终端中...最新AI资源# AI开放服务1年前042.1K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具灵码 IDE是通义灵码推出的AI原生集成开发环境(IDE),深度适配千问3大模型,具备强大的编程智能体模式,支持自主完成工程感知、代码检索、执行终端操作等任务。它支持MCP工具,集成魔搭MCP广场的3...最新AI资源9个月前042.1K
wcplusPro - 微信公众号数据采集与分析工具,提供数据管理功能wcplusPro是专业的微信公众号数据采集与分析工具。工具支持采集公众号历史文章及多种数据(如标题、内容、阅读量等),提供高效的数据管理功能,支持处理百万级别文章的快速检索与排序。wcplusPro...最新AI资源9个月前042.1K
RedOne - 小红书最新推出的社交大模型RedOne 是小红书推出的专为社交网络定制的大语言模型。模型通过三阶段训练策略,融入社交文化知识,强化多任务能力,并对齐人类偏好。RedOne 在社交任务性能上显著优于基础模型,在有害内容检测和浏览...最新AI资源7个月前042.1K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型GLM-4.5 是智谱推出的开源 SOTA 模型,专为智能体应用设计,融合推理、代码生成和智能体能力。模型基于混合专家(MoE)架构,包含两个版本,3550 亿参数的 GLM-4.5 和 1060 亿...最新AI资源8个月前042K
Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列Kandinsky 5.0是俄罗斯AI团队开发的最新视频生成模型系列,主打轻量化设计与高性能表现。系列首款模型Kandinsky 5.0 Video Lite仅20亿参数却超越了同类14B大模型,尤其...最新AI资源5个月前041.9K
Genie 3 - 谷歌推出的通用世界模型Genie 3 是谷歌 DeepMind 推出的新一代通用世界模型,支持实时生成高度动态且连贯的虚拟世界。Genie 3 能模拟物理现象、自然生态系统,还支持创建奇幻场景和历史场景。用文本提示,用户能...最新AI资源7个月前041.9K
Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型Mureka V7.5 是昆仑万维推出的先进 AI 音乐生成模型,专注于中文歌曲创作。模型能精准还原音色与演奏技法,生成自然流畅且富有情感的歌声。基于优化的自动语音识别(ASR)技术,Mureka V...最新AI资源7个月前041.8K
绘想 - 百度推出的AI视频生成平台绘想是百度推出的 AI 视频生成平台,基于 AI 技术助力用户轻松打造个性化视频。绘想界面直观,工具强大,具备灵感推荐功能,能为创作者提供创意启发,支持一键同款操作,能快速生成相似视频,简化创作流程。最新AI资源9个月前041.8K
11ai - ElevenLabs推出个人AI语音助理11ai是ElevenLabs推出的AI语音助理,以语音交互为核心,通过自然流畅的对话提升用户的工作效率。11ai支持超过 5000 种声音,用户可以自定义专属语音,助理更具个性化。具备低延迟的语音互...最新AI资源9个月前041.8K
MoE-TTS - 昆仑万维推出的最新语音生成框架MoE-TTS 是昆仑万维推出的语音合成框架,基于混合专家(MoE)架构,将预训练的大型语言模型(LLM)与语音专家模块结合。MoE-TTS 通过冻结文本模块参数、仅更新语音模块参数,保留强大的文本理...最新AI资源7个月前041.8K
AopsAI - AI照片处理工具,一键将旧照片转动态视频AopsAI 是将旧照片转化为动态短视频的在线 AI 工具。工具基于先进的 AI 技术,让静态照片“动”起来,重现过去的美好瞬间。用户上传照片提供邮箱地址,AopsAI 自动在 24 小时内生成视频发...最新AI资源9个月前041.7K
ScienceOne - 中国科学院自动化研究所等机构推出的智能科研平台ScienceOne是中国科学院自动化研究所联合多家单位共同推出的智能科研平台。平台基于科学基础大模型构建,推动多学科协同的智能科研新范式,为科研全流程提供支持。ScienceOne核心产品包括S1...最新AI资源9个月前041.7K
CombatVLA - 淘天集团推出的高效VLA模型CombatVLA是淘天集团未来生活实验室团队推出的创新3D动作角色扮演游戏(ARPG)专用模型。CombatVLA是视觉-语言-动作(VLA)模型,基于3B参数规模构建,通过动作追踪器收集人类玩家的...最新AI资源7个月前041.7K
Claude Opus 4.1 - Anthropic推出的最强编程模型Claude Opus 4.1 是 Anthropic 公司推出的先进大型语言模型,专为高效处理复杂任务而设计。模型在编程领域表现出色,能生成高质量代码,支持长达 32k 的单次输出,适应多种编程风格...最新AI资源7个月前041.7K
Lemon Slice Live - Lemon Slice推出的 AI 实时视频聊天工具Lemon Slice Live 是 Lemon Slice 公司推出的实时视频聊天 AI 工具。Lemon Slice Live基于扩散变换器模型(DiT),支持将任意照片或插画转化为能实时互动的动...最新AI资源9个月前041.7K
Lucy Edit - 开源的AI视频编辑工具,自然语言描述编辑Lucy Edit 是开源的 AI 视频编辑工具,由 Decart AI 开发。允许用户通过简单的自然语言描述来编辑视频,例如“将人物换成北极熊”或“把场景变成2D卡通风格”,无需复杂的微调或使用遮罩...最新AI资源6个月前041.7K
ThinkSound - 阿里通义推出的音频生成模型ThinkSound是阿里通义语音团队推出的首个CoT(链式思考)音频生成模型。模型能为视频画面生成精准匹配的音效,基于引入CoT推理,解决传统技术难以捕捉画面动态细节和空间关系的问题。最新AI资源9个月前041.6K
Mu - 微软推出的小参数语言模型,支持Windows智能体Mu是微软推出的小参数语言模型,参数量仅3.3亿,专为在NPU和边缘设备上高效运行设计。模型基于编码器解码器架构,通过硬件感知优化、模型量化及特定任务微调,实现每秒超100 tokens的响应速度。M...最新AI资源9个月前041.6K
InteriorGS - 群核科技推出的3D高斯语义数据集InteriorGS是群核科技推出的高质量3D高斯语义数据集。数据集包含1000个3D场景,涵盖80多种室内环境,如家庭、便利店、婚宴厅和博物馆等。数据集中有755个类别的554,000多个对象实例...最新AI资源7个月前041.6K
Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型Gemini 2.5 Flash Image(代号nano banana)是谷歌推出的先进图像生成与编辑模型,能保持角色在不同场景中的一致性,支持通过自然语言进行精准图像编辑,如模糊背景、消除污渍等。最新AI资源7个月前041.6K
Seed Diffusion - 字节跳动最新推出的扩散语言模型Seed Diffusion 是字节跳动推出的实验性扩散语言模型,能处理代码生成任务。模型基于两阶段扩散训练、约束顺序学习和强化高效并行解码等技术,显著提升推理速度,达到2146 tokens/s,比...最新AI资源8个月前041.6K
Gemini CLI - 谷歌开源的编程AgentGemini CLI 是谷歌开源的 AI 编程工具,基于将 Gemini 大模型融入开发者终端,为开发者提供强大的 AI 功能。工具能理解代码、操作文件、执行命令并动态排查问题,帮助开发者高效地编写代...最新AI资源9个月前041.5K
企鹅读伴 - 腾讯推出的中小学生AI阅读助手企鹅读伴是腾讯推出的专为中小学生设计的AI阅读助手。企鹅读伴依托腾讯混元大模型和元器平台,结合《义务教育语文课程方案和课程标准(2022年版)》,为学生提供个性化阅读推荐、多种阅读模式(专注、朗读、听...最新AI资源9个月前041.5K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助Olovka AI 是为学生打造的AI学术写作辅助平台,平台根据学生的学术水平、专业领域和论文类型,提供精准的写作建议和辅助。基于智能算法,Olovka AI 帮助学生快速撰写高质量的学术论文,将论文...最新AI资源9个月前041.5K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型HunyuanVideo-Avatar是腾讯混元团队与腾讯音乐天琴实验室联合推出的先进语音数字人模型。模型基于创新的多模态扩散Transformer架构,根据用户上传的人物图像和音频,生成具有自然表情...最新AI资源9个月前041.4K
MoFlow - AI情绪管理应用,用自由书写调节情绪MoFlow是结合心理学与AI技术的情绪管理应用。为用户提供了一个私密空间,让用户可以通过书写、聊天等方式表达情绪,AI伙伴会耐心倾听给予反馈。最新AI资源9个月前041.4K
Hailuo Video Agent - MiniMax推出的AI视频创作AgentHailuo Video Agent 是 MiniMax 稀宇科技推出的零门槛AI视频创作Agent,开放Beta版本。通过简单的文字输入或图片上传,可一键生成高质量的创意视频,涵盖多种应用场景,如广...最新AI资源9个月前041.3K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型Intern-S1-mini 是上海人工智能实验室推出的轻量化科学多模态大模型,参数规模为 8B。继承了 Intern-S1 的强大能力,兼具通用与专业科学能力,适合快速部署和二次开发。在性能方面,I...最新AI资源7个月前041.3K
商汤如影 - 商汤科技推出的AI数字人视频制作平台商汤如影是商汤科技推出的AI数字人视频制作平台。平台基于大模型技术,支持创建高度逼真的数字人形象,支持个性化定制,包括面部特征、服装、发型等。平台具备声音克隆、视频生成、自动化数据标注、实时互动等功能...最新AI资源9个月前041.3K
日日新 V6.5 - 商汤科技推出的最新多模态推理大模型日日新 V6.5 是商汤科技推出的先进多模态推理大模型,专为处理图像与文本混合输入而设计,支持精准理解图像内容并结合文本生成描述或回答问题。最新AI资源8个月前041.2K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型Agentar-Fin-R1是蚂蚁数科推出的面向金融领域的先进大语言模型。模型基于强大的Qwen3架构开发,提供8B和32B两种参数规模版本,能精准处理复杂的金融推理任务,包括多步骤分析、风险评估和战...最新AI资源8个月前041.1K
稿定AI社区 - AI创意内容设计平台,多种设计资源满足不同创作需求稿定AI社区是在线AI创意灵感平台,为用户提供丰富的创意设计资源和工具。平台涵盖多种设计领域,包括形象照、电商设计、节日主题、3D插画、头像设计、小红书素材、人像设计等,满足不同用户的需求。最新AI资源10个月前041K
MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架MagicTryOn 是浙江大学计算机科学与技术学院联合 vivo 等机构推出的先进的视频虚拟试穿框架。框架用创新的扩散Transformer(DiT)架构,替代传统的U-Net架构,结合全自注意力机...最新AI资源9个月前041K
gpt-realtime - OpenAI最新推出的AI语音模型gpt-realtime 是 OpenAI 推出的先进语音模型,支持直接处理音频,生成自然流畅的语音。模型支持多种语言和风格,能理解非语言线索,如笑声,能在不同语言间切换。最新AI资源7个月前040.9K
Mureka V7 - 昆仑万维推出的AI音乐生成模型Mureka V7 是昆仑万维推出的先进 AI 音乐生成模型。模型基于 MusiCoT 技术,支持先规划音乐的整体结构,再填充细节,生成更具连贯性和艺术性的音乐作品。最新AI资源8个月前040.8K
Qwen3Guard - 阿里Qwen开源的安全模型Qwen3Guard 是基于 Qwen3 基础模型微调的安全防护模型,专为安全检测而设计。能对提示词和响应进行精确的安全分类,提供风险等级,支持英语、中文和多语言环境。Qwen3Guard 有两个专业...最新AI资源6个月前040.8K
悟能 - 商汤科技最新推出的具身智能平台悟能是商汤科技推出的具身智能平台,专为机器人和智能设备设计。悟能基于“开悟”世界模型与多模态大模型技术,整合视觉、语音、触觉等多传感器输入,具备强大的感知、决策和行动能力。最新AI资源8个月前040.8K
自动生成每日Product Hunt热门产品榜单综合介绍 Product Hunt 每日中文热榜是一个基于 GitHub Actions 的自动化工具,能够每天定时生成 Product Hunt 上的热门产品榜单,并以 Markdown 文件的形式...最新AI资源# AI开源项目2年前040.8K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型Qwen3-Coder-Flash 是阿里通义千问团队推出的高性能编程模型,具备卓越的代理式编程和工具调用能力,擅长处理复杂编程任务。模型支持 256K tokens 的长上下文理解,能扩展至 1M ...最新AI资源8个月前040.7K
SpatialGen - 群核科技推出的开源3D场景生成模型SpatialGen 是群核科技开源的 3D 场景生成模型,基于扩散模型架构,支持根据文字描述、参考图像和 3D 空间布局生成时空一致的多视角图像,并进一步生成 3D 高斯场景,渲染出漫游视频。最新AI资源7个月前040.7K
Claudable - 开源AI Web应用构建器,自然语言生成代码Claudable 是基于 Next.js 的开源 Web 应用构建器,结合了 Claude Code 和 Cursor CLI 的先进 AI 代理能力,以及 Lovable 简单直观的应用构建体验...最新AI资源6个月前040.7K
UnifiedTTS - 一站式TTS API服务平台,实时性能监控UnifiedTTS 是一站式文本转语音(TTS)服务的平台。支持多种语言,包括中文、英文、日文和韩文等,能满足全球业务的需求。通过统一的 API 接口,整合多种主流的 TTS 服务,包括 Micro...最新AI资源6个月前040.6K
Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版Skywork Deep Research Agent v2 是昆仑万维推出的深度研究智能体,专注于多模态信息的整合与分析。Skywork Deep Research Agent v2 能处理文本、图...最新AI资源7个月前040.6K
DragonV2.1 - 微软推出的零样本语音合成模型DragonV2.1 是微软推出的先进的零样本文本到语音(TTS)模型。模型基于 Transformer 架构,支持多语言和零样本语音克隆,仅需 5-90 秒的语音提示能生成自然、富有表现力的语音。最新AI资源7个月前040.6K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析综合介绍 Infini-Megrez是由无问芯穹(Infinigence AI)开发的边缘智能解决方案,旨在通过软硬件协同设计,实现高效的多模态理解和分析。该项目的核心是Megrez-3B模型,支持图...最新AI资源# AI开源项目# 多模态实时互动产品1年前040.6K
羚珑 - 京东推出的AI商品图设计工具羚珑是京东推出的智能设计工具,为电商商家和个人提供高效便捷的设计解决方案。通过智能抠图、智能排版、智能配色等功能,帮助用户快速生成高质量的设计作品,满足商品主图、广告Banner、店铺页面等多种电商场...最新AI资源9个月前040.5K
Vace AI - AI 视频制作和编辑平台,提供一站式视频创作服务Vace AI 是强大的一站式 AI 视频制作和编辑平台。平台基于文本描述或参考图像生成高质量的视频内容,支持视频扩展、风格转换、主体移除与重建等多种编辑功能。最新AI资源9个月前040.5K
Magentic-UI - 微软开源的人机协作AI AgentMagentic-UI是微软开源的人机协作AI Agent研究工具。Magentic-UI基于与用户紧密协作,助力完成复杂的Web任务,比如网页浏览、代码执行和文件处理等。工具强调协作规划,让用户能提...最新AI资源9个月前040.5K
ChatGPT Agent – OpenAI推出的通用智能AI AgentChatGPT Agent 是 OpenAI 推出的通用AI Agent,融合多种能力,能自主完成复杂任务。用户只需用自然语言描述需求,Agent 能自动选择合适工具,比如浏览网页、提取信息、运行代码...最新AI资源8个月前040.4K
Shortbread - AI漫画生成工具,自然语言描述完成漫画创作Shortbread是AI漫画生成工具,用户基于简单的自然语言描述快速创作出完整的漫画作品。Shortbread无需任何绘图技能,只需输入文字,AI快速生成具有独特角色、场景和情感的个性化漫画。Sho...最新AI资源9个月前040.4K
HeyGen - AI 数字人视频创作平台,支持多语言翻译配音HeyGen是AI驱动的数字人视频创作平台,支持简化视频制作流程,让用户快速生成专业水准的数字人视频。平台基于先进的AI技术,赋予用户对数字人物形象和声音的完全控制权,提供丰富的素材库,包括多样化背景...最新AI资源9个月前040.4K
琴乐大模型 - 腾讯推出的AI音乐创作模型琴乐大模型是腾讯AI Lab与腾讯TME天琴实验室联合推出的先进AI音乐创作大模型。模型根据用户输入的中英文关键词、描述性语句或音频片段,智能生成高质量的立体声音频或多轨乐谱。最新AI资源9个月前040.3K
ViMax - 香港大学开源的多智能体视频生成框架ViMax是香港大学数据科学实验室开源的多智能体视频生成框架,能实现从创意输入到视频输出的全流程自动化。整合了剧本生成、分镜设计、镜头规划和视频渲染等功能,支持用户通过自然语言描述生成连贯的影视级视频...最新AI资源4个月前040.3K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等综合介绍 报告生成工具(Report mAIstro)是一个强大的工具,旨在通过自然语言处理技术,帮助用户轻松创建自定义报告。该工具利用LangChain技术,将用户提供的主题和结构转化为详细的报告内...最新AI资源# AI开源项目# 生成深度研究报告12个月前040.2K
AI Agent Company Researcher:自动化公司信息研究情报员综合介绍 AI公司研究助手是一个基于人工智能的工具,旨在自动化公司研究和潜在客户挖掘过程。通过使用LangGraph和FireCrawl等技术,该工具能够在短短几分钟内生成详细的公司研究报告。用户只需...最新AI资源1年前040.2K
HIRING.STUDIO - AI招聘面试辅助工具,针对特定职位生成面试问题HIRING.STUDIO 是 AI 招聘面试辅助工具,帮助招聘团队高效创建针对特定职位的面试问题。工具基于 AI 技术,生成面试问题、建议后续问题,为不同质量的答案制定评估标准。工具支持STAR方法...最新AI资源9个月前040.2K
问小白5 - 问小白推出的全能AI模型问小白5是“All in One”旗舰大模型,智能水平极高。模型在多项评测中表现卓越,如AA - Index综合评估得分64.7分,STEM能力评测86分,接近全球领先的GPT - 5。最新AI资源7个月前040.1K
分析 civitai 226K 得到的常用正负面提示词资源列表前10 1000 个最常见的 Tokens 1000 个最常见的负面 Tokens 20 个最常见的采样器 100 个最常见的步骤 100 个最常见的尺寸 50 个最常见的...最新AI资源# AI图像生成辅助工具1年前040.1K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议A2UI(Agent-to-User Interface)是谷歌开源的Agent驱动型界面协议,解决AI代理生成复杂交互界面的难题。通过一种声明式JSON格式,让AI代理描述用户界面的结构,客户端应用...最新AI资源3个月前040.1K
ML-Master – 上海交大推出的AI专家AgentML-Master是上海交通大学人工智能学院Agents团队推出AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色,以29.3%的平均奖牌率位居榜首,超越了微软的RD-Agent...最新AI资源9个月前040K
Klic Studio - AI音视频翻译配音工具,一键部署全流程Klic Studio(原Krillin AI)是基于AI的视频翻译、配音和语音克隆工具,专为视频创作者和内容出海者设计。支持一键部署全流程,可将视频从下载到成品输出一键完成,适配抖音、小红书、B站...最新AI资源9个月前040K
Magistral - Mistral AI 推出的系列推理模型Magistral 是 Mistral AI 推出的推理模型,专注透明、多语言和特定领域的推理能力。模型包含开源版(Magistral Small)和企业版(Magistral Medium),后者在...最新AI资源9个月前040K