觅果·Migo - AI学术研究助手,智能问答满足多样化需求觅果·Migo是AI驱动的学习与研究创新平台,具备强大的多模态AI能力,支持文本、语言、视觉和数据处理,能满足跨学科的多样化需求。觅果·Migo提供智能问答、网页辅读、文献阅读、学术写作、论文阅读、化...最新AI资源11个月前050.2K
小星绪 - 京东健康推出的AI情绪漫画生成产品小星绪是京东健康推出的AI情绪漫画生成产品,目前处于测试阶段,产品以情绪驱动漫画故事生成为核心功能,用户能通过语音或文字输入表达情绪或讲述故事,AI根据输入生成匹配的四格漫画及故事解读。最新AI资源9个月前050.2K
靠岸妙写 - AI论文写作工具,构思到成稿一站式解决靠岸妙写是AI论文写作工具,为学术写作提供高效、便捷的解决方案。工具支持一键生成论文大纲、摘要和正文初稿,适用本科、硕士等不同层次的学术需求,覆盖理工科、文科和社科等多学科领域。最新AI资源11个月前050.2K
ConverzAI - AI招聘平台,自动收集候选人信息进行筛选ConverzAI是基于AI技术的招聘平台,能优化招聘流程。平台基于部署虚拟招聘人员(AI Agents),自动从申请追踪系统(ATS)中收集候选人信息并进行初步筛选。平台用电话、邮件、短信等多种渠道...最新AI资源11个月前050.2K
ChatGPT Study - OpenAI推出的创新学习模式ChatGPT Study 是 OpenAI 推出的创新学习模式,能帮助用户更高效地学习和理解知识。ChatGPT Study 通过苏格拉底式提问、支架式响应和个性化教学,引导用户主动思考,逐步解决问...最新AI资源9个月前050.1K
Seed Diffusion - 字节跳动最新推出的扩散语言模型Seed Diffusion 是字节跳动推出的实验性扩散语言模型,能处理代码生成任务。模型基于两阶段扩散训练、约束顺序学习和强化高效并行解码等技术,显著提升推理速度,达到2146 tokens/s,比...最新AI资源9个月前050.1K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型Seed GR-3 是字节跳动推出的通用机器人模型,具有强大的泛化能力,能适应新环境和复杂指令。模型融合视觉、语言和动作信息,基于机器人数据、VR 人类轨迹数据和公开图文数据的三合一训练法,提升对新物...最新AI资源9个月前050.1K
wcplusPro - 微信公众号数据采集与分析工具,提供数据管理功能wcplusPro是专业的微信公众号数据采集与分析工具。工具支持采集公众号历史文章及多种数据(如标题、内容、阅读量等),提供高效的数据管理功能,支持处理百万级别文章的快速检索与排序。wcplusPro...最新AI资源11个月前050.1K
浙江大学免费PDF资料《大模型基础》 - 附下载链接《大模型基础》深入剖析大语言模型(LLMs)的核心技术与实践路径。从语言模型的基础理论入手,系统讲解基于统计、循环神经网络(RNN)和Transformer架构的模型设计原理,重点探讨大语言模型的三大...最新AI资源课程资料7个月前050.1K
妙构 - AI视频分析与生成工具,揭示爆款视频创作规律妙构是专业的AI视频内容分析与生成工具,基于深度学习算法,全方位解析视频的视觉、音频和创意结构,揭示爆款视频背后的规律。妙构能分析构图、色彩、镜头语言,评估创意独特性与情感共鸣,提供趋势洞察和优化建议...最新AI资源11个月前050K
MuseSteamer - 百度推出的视频生成大模型MuseSteamer是百度推出的多模态视频生成大模型。模型能根据用户提供的文字描述或图片,快速生成高质量的动态视频内容,支持多种清晰度和功能版本,满足不同场景下的创作需求。最新AI资源10个月前050K
图可丽 - AI图像处理工具,一键图像和视频抠图神器图可丽是AI图像处理工具,专注于提供高效便捷的图片和视频编辑服务。基于先进的人工智能技术,能快速实现一键抠图、视频处理、照片修复与美化、AI绘画以及背景更换等多种功能。最新AI资源10个月前050K
Step-Audio 2 mini - 阶跃星辰开源的语音大模型Step-Audio 2 mini 是阶跃星辰开源的端到端语音大模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音响应输出,时延更低,能理解副语言信息与非人声信号。最新AI资源8个月前050K
Make - AI无代码自动化工作流搭建平台Make是AI驱动的无代码自动化平台,帮助企业基于自动化流程提升效率和创新能力。平台提供超过2000个预建应用,支持多种业务场景,如营销、销售、财务等。Make的核心功能包括无代码可视化流程创建、AI...最新AI资源11个月前049.9K
FastVLM - 苹果公司推出的视觉语言模型FastVLM(Fast Vision Language Model)是苹果公司推出的高效视觉语言模型。以FastViTHD混合视觉编码器为核心,融合了卷积和Transformer架构,可显著减少视觉...最新AI资源8个月前049.9K
FastDeploy - 百度推出的高性能大模型推理与部署工具FastDeploy 是百度推出的高性能推理与部署工具,专为大语言模型(LLMs)和视觉语言模型(VLMs)设计。FastDeploy 基于飞桨(PaddlePaddle)框架开发,支持多种硬件平台...最新AI资源9个月前049.9K
Hunyuan3D-Omni - 腾讯混元开源的3D模型生成框架Hunyuan3D-Omni(混元3D-Omni)是腾讯混元3D团队开源的3D资产生成框架,通过多种控制信号实现精准的3D模型生成。基于Hunyuan3D 2.1架构,引入了统一的控制编码器,可处理点...最新AI资源7个月前049.9K
Vortn:利用AI编写与管理企业内部知识库综合介绍 Vortn 是一个专注于智能知识存储和管理的平台,通过AI代理和访问控制系统为用户提供个性化的知识管理服务。平台支持使用AI聊天功能,根据上下文提供智能响应,帮助用户更好地组织、访问和利用信...最新AI资源# 知识检索与RAG框架1年前049.9K
MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型MinerU2.5是上海人工智能实验室与北京大学团队联合研发的解耦式视觉语言模型,专注于高效处理高分辨率文档图像解析。核心创新在于采用"先全局版面检测后局部内容识别"的两阶段设计:第一阶段通过低分辨率...最新AI资源6个月前049.9K
dots.vlm1 - 小红书hi lab开源的多模态大模型dots.vlm1 是小红书 hi lab 开源的首个多模态大模型。基于从零训练的 12 亿参数视觉编码器 NaViT 和 DeepSeek V3 大语言模型(LLM),具备强大的视觉感知和文本推理能...最新AI资源9个月前049.8K
Tizzy.ai - 百度推出的AI搜索应用Tizzy.ai 是百度推出的 AI 智能搜索应用。Tizzy.ai 基于百度的大模型技术,具备强大的智能搜索功能,能快速回答问题、深度思考和辅助决策。Tizzy.ai 界面简洁,无广告和弹窗,底部导...最新AI资源10个月前049.8K
GLM-Experimental - 智谱AI推出的实验性模型GLM-Experimental 是智谱 AI 推出的实验性大语言模型,已在 Z.ai 平台上线。模型具备自动生成 PPT 的能力,用户输入主题或要点后,模型能快速生成结构清晰、格式规范的演示文稿,将...最新AI资源10个月前049.8K
探饭 - 字节跳动推出的AI美食推荐工具探饭是字节跳动旗下抖音推出的AI美食推荐工具,依托豆包大模型,为用户提供个性化美食推荐、探店对比、美食攻略等服务。探饭能根据用户口味偏好和位置,精准推荐附近餐厅和菜品,支持辅助点菜,提供团购和外卖服务...最新AI资源10个月前049.7K
Muzaic - AI音乐生成平台,一键生成与视频内容匹配的音乐Muzaic 是 AI 驱动的在线音乐生成平台,专为视频制作人和内容创作者设计。Muzaic支持基于 AI 技术快速生成与视频内容匹配的定制音乐,仅需 8 秒生成一分钟的录音室级别音轨。最新AI资源11个月前049.7K
Step-Audio-AQAA – StepFun推出的端到端大音频语言模型Step-Audio-AQAA 是 StepFun 团队推出的端到端大型音频语言模型,用于音频查询-音频回答(AQAA)任务。能直接处理音频输入生成自然、准确的语音回答,无需依赖传统的自动语音识别(A...最新AI资源10个月前049.7K
VoxCPM - 面壁智能联合清华开源的端到端TTS模型VoxCPM 是面壁智能与清华大学深圳国际研究生院联合开源的语音生成模型。VoxCPM 采用端到端的扩散自回归架构,直接从文本生成连续语音表示,突破了传统离散分词的局限。通过分层语言建模和有限状态量化...最新AI资源7个月前049.7K
MonkeyCode - 开源的企业级AI编程助手MonkeyCode 是开源的企业级本地 AI 编程助手,专为注重隐私和安全的开发团队设计。MonkeyCode 支持私有化部署和离线使用,确保代码数据安全。工具功能强大,包括智能代码补全、自然语言编...最新AI资源9个月前049.7K
V-JEPA 2 - Meta AI 推出的最强世界大模型V-JEPA 2 是 Meta AI 推出的基于视频数据的世界大模型,拥有 12 亿参数。模型基于自监督学习从超过 100 万小时的视频和 100 万张图像中训练而成,能理解物理世界中的物体、动作和运...最新AI资源11个月前049.6K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版DeepSeek-R1是杭州深度求索公司DeepSeek推出的高性能AI推理模型,对标OpenAI的o1正式版。模型基于大规模强化学习技术进行后训练,仅需极少量标注数据,便能在数学、代码和自然语言推理...最新AI资源11个月前049.6K
MiroThinker 1.5 - MiroMind 团队开源的搜索智能体模型MiroThinker 1.5 是 MiroMind 团队开源的搜索智能体模型,基于 Qwen3 系列开发,包含 30B 和 235B 两种参数规模版本。模型采用交互式扩展技术,支持 256K 上下文...最新AI资源4个月前049.6K
MiniMax-M1 - MiniMax推出的开源推理模型MiniMax-M1 是 MiniMax 团队推出的开源推理模型,基于混合专家架构(MoE)与闪电注意力机制(Lightning Attention)相结合,总参数量达 4560 亿。模型支持 100...最新AI资源11个月前049.5K
宠TA - 京东推出的AI宠物互动产品宠TA是京东推出的AIGC宠物互动产品,能为宠物爱好者提供充满乐趣和温馨的在线互动平台。支持用户为自己的宠物选择各种可爱的服装和配饰,进行个性化装扮,且能创建宠物的数字形象,与之进行丰富互动。平台提供...最新AI资源10个月前049.4K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议A2UI(Agent-to-User Interface)是谷歌开源的Agent驱动型界面协议,解决AI代理生成复杂交互界面的难题。通过一种声明式JSON格式,让AI代理描述用户界面的结构,客户端应用...最新AI资源4个月前049.4K
Squibler - AI小说辅助写作平台,助力构思到创作全过程Squibler 是强大的 AI 辅助写作平台,专为作家设计,能帮助用户从构思到创作再到出版的全过程。平台提供多种故事模板,涵盖小说、剧本、短篇故事等,用户只需输入初始概念,AI 能生成大纲、角色、场...最新AI资源8个月前049.4K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架RoboOS 2.0 是智谱开源的跨本体大小脑协同框架,推动机器人从单一智能向群体协作智能转变。框架用“大小脑”架构实现高效分工,云端大脑负责复杂决策与协同,小脑模块专注于执行具体技能。最新AI资源10个月前049.4K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架OmniTalker是阿里巴巴推出的实时文本驱动的说话头像生成框架。框架能同时处理文本、图像、音频和视频等多种模态输入,基于流式方式生成自然语音响应。核心基于Thinker-Talker架构,Thin...最新AI资源10个月前049.4K
JoyHallo - 京东开源的AI数字人模型JoyHallo是京东开源的AI数字人模型,专为普通话设计,支持将音频转化为逼真的说话视频。JoyHallo基于wav2vec2模型嵌入音频特征,用半解耦结构,提升唇部运动预测准确性,支持生成英语视频...最新AI资源11个月前049.4K
GLM-4.7 - 智谱AI开源的最新一代旗舰大模型GLM-4.7是智谱AI发布并开源的最新一代旗舰大模型,主要针对AI编程、复杂推理和智能体任务进行了深度优化。模型支持200k上下文长度和128k最大输出,具备多语言编码、长程任务规划和工具协同能力...最新AI资源4个月前049.3K
InteriorGS - 群核科技推出的3D高斯语义数据集InteriorGS是群核科技推出的高质量3D高斯语义数据集。数据集包含1000个3D场景,涵盖80多种室内环境,如家庭、便利店、婚宴厅和博物馆等。数据集中有755个类别的554,000多个对象实例...最新AI资源9个月前049.3K
日日新 V6.5 - 商汤科技推出的最新多模态推理大模型日日新 V6.5 是商汤科技推出的先进多模态推理大模型,专为处理图像与文本混合输入而设计,支持精准理解图像内容并结合文本生成描述或回答问题。最新AI资源9个月前049.3K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助Olovka AI 是为学生打造的AI学术写作辅助平台,平台根据学生的学术水平、专业领域和论文类型,提供精准的写作建议和辅助。基于智能算法,Olovka AI 帮助学生快速撰写高质量的学术论文,将论文...最新AI资源11个月前049.3K
幕布 - AI大纲笔记工具,复杂信息一键生成思维导图幕布是AI大纲笔记工具,帮助用户将零散的知识点基于结构化大纲形式系统化,工具支持一键生成思维导图。幕布支持将复杂信息以直观图形呈现,助力快速理清思路,提升理解和记忆效率。最新AI资源11个月前049.2K
Hyperbolic AgentKit:让Agents拥有自己的计算资源,能够自主管理 GPU、执行区块链操作和社交发布综合介绍 Hyperbolic AgentKit是一个开源项目,旨在提供一个运行AI代理的模板,结合了区块链和计算能力。该项目基于Coinbase的CDP Agentkit进行修改和扩展,支持在终端中...最新AI资源# AI开放服务1年前049K
Doppl - 谷歌推出的AI虚拟试衣应用Doppl是谷歌推出的AI虚拟试衣应用。用户上传全身照片后,应用支持将服装图片或截图“穿”在数字版自己身上,且能将静态图片转换为AI生成的视频,让用户更真切地感受服装上身效果。最新AI资源10个月前049K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型Skywork UniPic 2.0 是昆仑万维开源的高效多模态模型,专注于图像生成、编辑与理解。模型基于 2B 参数的 SD3.5-Medium 架构,通过预训练、渐进式双任务强化策略和联合训练,实...最新AI资源9个月前049K
Claude Opus 4.1 - Anthropic推出的最强编程模型Claude Opus 4.1 是 Anthropic 公司推出的先进大型语言模型,专为高效处理复杂任务而设计。模型在编程领域表现出色,能生成高质量代码,支持长达 32k 的单次输出,适应多种编程风格...最新AI资源9个月前048.9K
ROMA - 开源的元Agent框架,自动分解复杂任务并行处理ROMA(Recursive-Open-Meta-Agent)是Sentient AGI开发的开源元代理框架,通过递归任务分解和并行处理来高效解决复杂问题。支持Python 3.12+、Docker和...最新AI资源8个月前048.9K
Gemini CLI - 谷歌开源的编程AgentGemini CLI 是谷歌开源的 AI 编程工具,基于将 Gemini 大模型融入开发者终端,为开发者提供强大的 AI 功能。工具能理解代码、操作文件、执行命令并动态排查问题,帮助开发者高效地编写代...最新AI资源10个月前048.9K
AopsAI - AI照片处理工具,一键将旧照片转动态视频AopsAI 是将旧照片转化为动态短视频的在线 AI 工具。工具基于先进的 AI 技术,让静态照片“动”起来,重现过去的美好瞬间。用户上传照片提供邮箱地址,AopsAI 自动在 24 小时内生成视频发...最新AI资源11个月前048.9K
ChartAI - AI数据分析工具,智能推荐适合的图表类型ChartAI 是高效的数据可视化工具,基于 AI 技术自动分析数据,生成直观的图表,帮助用户快速理解复杂信息。ChartAI支持多种数据格式(如 Excel、CSV)的导入,支持智能推荐最适合的图表...最新AI资源11个月前048.8K
MoFlow - AI情绪管理应用,用自由书写调节情绪MoFlow是结合心理学与AI技术的情绪管理应用。为用户提供了一个私密空间,让用户可以通过书写、聊天等方式表达情绪,AI伙伴会耐心倾听给予反馈。最新AI资源10个月前048.8K
ThinkSound - 阿里通义推出的音频生成模型ThinkSound是阿里通义语音团队推出的首个CoT(链式思考)音频生成模型。模型能为视频画面生成精准匹配的音效,基于引入CoT推理,解决传统技术难以捕捉画面动态细节和空间关系的问题。最新AI资源10个月前048.8K
ChatFlow - 开源AI工作流自动化工具ChatFlow 是开源的 AI 工作流自动化工具,支持将复杂的需求转化为高效的工作流程。工具基于 AI 技术,帮助用户快速生成代码框架、测试用例,能辅助写作和设计软件架构。最新AI资源9个月前048.7K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台Genie Envisioner(GE)是智元机器人团队联合新加坡国立大学、北京航空航天大学等机构开发的机器人操作统一平台。通过“先想象,后行动”的方式,让机器人更好地理解和执行任务。最新AI资源9个月前048.7K
Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列Kandinsky 5.0是俄罗斯AI团队开发的最新视频生成模型系列,主打轻量化设计与高性能表现。系列首款模型Kandinsky 5.0 Video Lite仅20亿参数却超越了同类14B大模型,尤其...最新AI资源7个月前048.7K
Mu - 微软推出的小参数语言模型,支持Windows智能体Mu是微软推出的小参数语言模型,参数量仅3.3亿,专为在NPU和边缘设备上高效运行设计。模型基于编码器解码器架构,通过硬件感知优化、模型量化及特定任务微调,实现每秒超100 tokens的响应速度。M...最新AI资源10个月前048.7K
HIRING.STUDIO - AI招聘面试辅助工具,针对特定职位生成面试问题HIRING.STUDIO 是 AI 招聘面试辅助工具,帮助招聘团队高效创建针对特定职位的面试问题。工具基于 AI 技术,生成面试问题、建议后续问题,为不同质量的答案制定评估标准。工具支持STAR方法...最新AI资源11个月前048.7K
11ai - ElevenLabs推出个人AI语音助理11ai是ElevenLabs推出的AI语音助理,以语音交互为核心,通过自然流畅的对话提升用户的工作效率。11ai支持超过 5000 种声音,用户可以自定义专属语音,助理更具个性化。具备低延迟的语音互...最新AI资源10个月前048.6K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析综合介绍 Infini-Megrez是由无问芯穹(Infinigence AI)开发的边缘智能解决方案,旨在通过软硬件协同设计,实现高效的多模态理解和分析。该项目的核心是Megrez-3B模型,支持图...最新AI资源# AI开源项目# 多模态实时互动产品1年前048.6K
MiDashengLM - 小米开源的声音理解模型MiDashengLM 是小米开源的高效声音理解大模型,具体参数版本为MiDashengLM-7B ,专注于音频处理与理解。模型基于 Xiaomi Dasheng 音频编码器和 Qwen2.5-Omn...最新AI资源9个月前048.6K
Genie 3 - 谷歌推出的通用世界模型Genie 3 是谷歌 DeepMind 推出的新一代通用世界模型,支持实时生成高度动态且连贯的虚拟世界。Genie 3 能模拟物理现象、自然生态系统,还支持创建奇幻场景和历史场景。用文本提示,用户能...最新AI资源9个月前048.5K
Mureka V7 - 昆仑万维推出的AI音乐生成模型Mureka V7 是昆仑万维推出的先进 AI 音乐生成模型。模型基于 MusiCoT 技术,支持先规划音乐的整体结构,再填充细节,生成更具连贯性和艺术性的音乐作品。最新AI资源9个月前048.5K
自动生成每日Product Hunt热门产品榜单综合介绍 Product Hunt 每日中文热榜是一个基于 GitHub Actions 的自动化工具,能够每天定时生成 Product Hunt 上的热门产品榜单,并以 Markdown 文件的形式...最新AI资源# AI开源项目2年前048.4K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型Agentar-Fin-R1是蚂蚁数科推出的面向金融领域的先进大语言模型。模型基于强大的Qwen3架构开发,提供8B和32B两种参数规模版本,能精准处理复杂的金融推理任务,包括多步骤分析、风险评估和战...最新AI资源9个月前048.4K
全球首个量子 AI 模型问世!SECQAI 发布 QLLM 即将进入 Beta 测试英国超安全软硬件公司 SECQAI 宣布推出全球首个量子大语言模型 (QLLM),将量子计算技术整合至传统 AI 模型中,以提升运算效率和问题解决能力。 量子力学 + AI = 更强大的 AI? ...最新AI资源1年前048.3K
Hailuo Video Agent - MiniMax推出的AI视频创作AgentHailuo Video Agent 是 MiniMax 稀宇科技推出的零门槛AI视频创作Agent,开放Beta版本。通过简单的文字输入或图片上传,可一键生成高质量的创意视频,涵盖多种应用场景,如广...最新AI资源10个月前048.3K
Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型Wan2.2-S2V 是阿里通义开源的多模态视频生成模型,只需一张静态图片和一段音频,能生成高质量的数字人视频,且支持多种图片类型和画幅。最新AI资源8个月前048.3K
Klic Studio - AI音视频翻译配音工具,一键部署全流程Klic Studio(原Krillin AI)是基于AI的视频翻译、配音和语音克隆工具,专为视频创作者和内容出海者设计。支持一键部署全流程,可将视频从下载到成品输出一键完成,适配抖音、小红书、B站...最新AI资源11个月前048.3K
羚珑 - 京东推出的AI商品图设计工具羚珑是京东推出的智能设计工具,为电商商家和个人提供高效便捷的设计解决方案。通过智能抠图、智能排版、智能配色等功能,帮助用户快速生成高质量的设计作品,满足商品主图、广告Banner、店铺页面等多种电商场...最新AI资源10个月前048.3K
MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架MagicTryOn 是浙江大学计算机科学与技术学院联合 vivo 等机构推出的先进的视频虚拟试穿框架。框架用创新的扩散Transformer(DiT)架构,替代传统的U-Net架构,结合全自注意力机...最新AI资源11个月前048.2K
剪影专业版6.0.x,新年快乐版无需会员就可以使用所有vip功能,解压即用,千万别升级!千万别升级!千万别升级! 链接:https://pan.quark.cn/s/a120ee707f47 提取码:jHDN最新AI资源1年前048.2K
AI Agent Company Researcher:自动化公司信息研究情报员综合介绍 AI公司研究助手是一个基于人工智能的工具,旨在自动化公司研究和潜在客户挖掘过程。通过使用LangGraph和FireCrawl等技术,该工具能够在短短几分钟内生成详细的公司研究报告。用户只需...最新AI资源1年前048.2K
稿定AI社区 - AI创意内容设计平台,多种设计资源满足不同创作需求稿定AI社区是在线AI创意灵感平台,为用户提供丰富的创意设计资源和工具。平台涵盖多种设计领域,包括形象照、电商设计、节日主题、3D插画、头像设计、小红书素材、人像设计等,满足不同用户的需求。最新AI资源11个月前048.1K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型Qwen-Image-Edit 是阿里通义推出的全能图像编辑模型,基于 200 亿参数的 Qwen-Image 架构构建。模型融合语义与外观的双重编辑能力,能对图像进行低层次的视觉外观编辑(如添加、删...最新AI资源8个月前048.1K
OpenAI《在AI时代保持领先》PDF指南 - 附下载链接《Staying ahead in the age of AI》是OpenAI推出的AI领导力指南,助力企业领导者在AI时代保持竞争优势。指南指出AI发展迅猛,模型发布速度加快、成本降低,企业采用速度...最新AI资源课程资料7个月前048.1K
Lemon Slice Live - Lemon Slice推出的 AI 实时视频聊天工具Lemon Slice Live 是 Lemon Slice 公司推出的实时视频聊天 AI 工具。Lemon Slice Live基于扩散变换器模型(DiT),支持将任意照片或插画转化为能实时互动的动...最新AI资源11个月前048.1K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型Qwen3-Coder-Flash 是阿里通义千问团队推出的高性能编程模型,具备卓越的代理式编程和工具调用能力,擅长处理复杂编程任务。模型支持 256K tokens 的长上下文理解,能扩展至 1M ...最新AI资源9个月前048.1K
CombatVLA - 淘天集团推出的高效VLA模型CombatVLA是淘天集团未来生活实验室团队推出的创新3D动作角色扮演游戏(ARPG)专用模型。CombatVLA是视觉-语言-动作(VLA)模型,基于3B参数规模构建,通过动作追踪器收集人类玩家的...最新AI资源8个月前048K
RedOne - 小红书最新推出的社交大模型RedOne 是小红书推出的专为社交网络定制的大语言模型。模型通过三阶段训练策略,融入社交文化知识,强化多任务能力,并对齐人类偏好。RedOne 在社交任务性能上显著优于基础模型,在有害内容检测和浏览...最新AI资源9个月前048K
QVQ-Max - 阿里通义推出视觉推理模型QVQ-Max是阿里通义推出的先进的视觉推理模型,是QVQ-72B-Preview的升级版。模型能“看懂”图片和视频内容,结合信息进行分析、推理和问题解决。QVQ-Max主要功能包括图像解析、视频分析...最新AI资源11个月前048K
Vace AI - AI 视频制作和编辑平台,提供一站式视频创作服务Vace AI 是强大的一站式 AI 视频制作和编辑平台。平台基于文本描述或参考图像生成高质量的视频内容,支持视频扩展、风格转换、主体移除与重建等多种编辑功能。最新AI资源11个月前048K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具SkyReels-A3 是昆仑万维集团推出的音频驱动数字人创作工具。能通过简单的输入(如人像图片和语音)生成高质量的动态视频内容,让静态照片“活”起来,可以为现有视频更换台词,人物会自动对上新的口型...最新AI资源9个月前047.9K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型Intern-S1-mini 是上海人工智能实验室推出的轻量化科学多模态大模型,参数规模为 8B。继承了 Intern-S1 的强大能力,兼具通用与专业科学能力,适合快速部署和二次开发。在性能方面,I...最新AI资源8个月前047.9K
悟能 - 商汤科技最新推出的具身智能平台悟能是商汤科技推出的具身智能平台,专为机器人和智能设备设计。悟能基于“开悟”世界模型与多模态大模型技术,整合视觉、语音、触觉等多传感器输入,具备强大的感知、决策和行动能力。最新AI资源9个月前047.9K
ML-Master – 上海交大推出的AI专家AgentML-Master是上海交通大学人工智能学院Agents团队推出AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色,以29.3%的平均奖牌率位居榜首,超越了微软的RD-Agent...最新AI资源10个月前047.9K
Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型Mureka V7.5 是昆仑万维推出的先进 AI 音乐生成模型,专注于中文歌曲创作。模型能精准还原音色与演奏技法,生成自然流畅且富有情感的歌声。基于优化的自动语音识别(ASR)技术,Mureka V...最新AI资源9个月前047.7K
Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型Gemini 2.5 Flash Image(代号nano banana)是谷歌推出的先进图像生成与编辑模型,能保持角色在不同场景中的一致性,支持通过自然语言进行精准图像编辑,如模糊背景、消除污渍等。最新AI资源8个月前047.7K
ChatGPT Agent – OpenAI推出的通用智能AI AgentChatGPT Agent 是 OpenAI 推出的通用AI Agent,融合多种能力,能自主完成复杂任务。用户只需用自然语言描述需求,Agent 能自动选择合适工具,比如浏览网页、提取信息、运行代码...最新AI资源10个月前047.7K
MoE-TTS - 昆仑万维推出的最新语音生成框架MoE-TTS 是昆仑万维推出的语音合成框架,基于混合专家(MoE)架构,将预训练的大型语言模型(LLM)与语音专家模块结合。MoE-TTS 通过冻结文本模块参数、仅更新语音模块参数,保留强大的文本理...最新AI资源9个月前047.7K
Lucy Edit - 开源的AI视频编辑工具,自然语言描述编辑Lucy Edit 是开源的 AI 视频编辑工具,由 Decart AI 开发。允许用户通过简单的自然语言描述来编辑视频,例如“将人物换成北极熊”或“把场景变成2D卡通风格”,无需复杂的微调或使用遮罩...最新AI资源7个月前047.7K
琴乐大模型 - 腾讯推出的AI音乐创作模型琴乐大模型是腾讯AI Lab与腾讯TME天琴实验室联合推出的先进AI音乐创作大模型。模型根据用户输入的中英文关键词、描述性语句或音频片段,智能生成高质量的立体声音频或多轨乐谱。最新AI资源11个月前047.6K
分析 civitai 226K 得到的常用正负面提示词资源列表前10 1000 个最常见的 Tokens 1000 个最常见的负面 Tokens 20 个最常见的采样器 100 个最常见的步骤 100 个最常见的尺寸 50 个最常见的...最新AI资源# AI图像生成辅助工具1年前047.6K
绘想 - 百度推出的AI视频生成平台绘想是百度推出的 AI 视频生成平台,基于 AI 技术助力用户轻松打造个性化视频。绘想界面直观,工具强大,具备灵感推荐功能,能为创作者提供创意启发,支持一键同款操作,能快速生成相似视频,简化创作流程。最新AI资源10个月前047.6K
UnifiedTTS - 一站式TTS API服务平台,实时性能监控UnifiedTTS 是一站式文本转语音(TTS)服务的平台。支持多种语言,包括中文、英文、日文和韩文等,能满足全球业务的需求。通过统一的 API 接口,整合多种主流的 TTS 服务,包括 Micro...最新AI资源8个月前047.6K
企鹅读伴 - 腾讯推出的中小学生AI阅读助手企鹅读伴是腾讯推出的专为中小学生设计的AI阅读助手。企鹅读伴依托腾讯混元大模型和元器平台,结合《义务教育语文课程方案和课程标准(2022年版)》,为学生提供个性化阅读推荐、多种阅读模式(专注、朗读、听...最新AI资源11个月前047.5K
Qwen3Guard - 阿里Qwen开源的安全模型Qwen3Guard 是基于 Qwen3 基础模型微调的安全防护模型,专为安全检测而设计。能对提示词和响应进行精确的安全分类,提供风险等级,支持英语、中文和多语言环境。Qwen3Guard 有两个专业...最新AI资源7个月前047.5K
Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版Skywork Deep Research Agent v2 是昆仑万维推出的深度研究智能体,专注于多模态信息的整合与分析。Skywork Deep Research Agent v2 能处理文本、图...最新AI资源9个月前047.5K
商汤如影 - 商汤科技推出的AI数字人视频制作平台商汤如影是商汤科技推出的AI数字人视频制作平台。平台基于大模型技术,支持创建高度逼真的数字人形象,支持个性化定制,包括面部特征、服装、发型等。平台具备声音克隆、视频生成、自动化数据标注、实时互动等功能...最新AI资源11个月前047.4K
Claudable - 开源AI Web应用构建器,自然语言生成代码Claudable 是基于 Next.js 的开源 Web 应用构建器,结合了 Claude Code 和 Cursor CLI 的先进 AI 代理能力,以及 Lovable 简单直观的应用构建体验...最新AI资源8个月前047.3K