Raycast:电脑桌面上万能的AI生产力工具综合介绍 Raycast 是一个专为 Mac 用户设计的全能生产力工具,通过一个简单的搜索框和快捷键操作,帮助用户快速启动应用、搜索文件、管理任务甚至控制智能家居。它不仅替代了 macOS 自带的 S...最新AI资源# AI开放服务1年前074.1K
火山方舟:大模型训练与云计算服务,注册送150元等额算力综合介绍 火山方舟 是火山引擎推出的一款专注于大模型服务的云计算平台,旨在为企业提供从模型选择、训练到应用的完整解决方案。依托字节跳动在AI领域的深厚积累,火山方舟整合了多家顶级AI公司的大模型资源...最新AI资源# AI开放服务1年前074.1K
Avatar Pose Maker:在线生成个性化立绘骨骼动作姿势综合介绍 Avatar Pose Maker是一款在线工具,用户可以通过它来设计和生成个性化的立绘动作。它允许用户创建喜欢的姿势,提供了一个简单而有效的方式来控制3D模型。特别适合初学者使用,因为它能...最新AI资源# AI图像生成辅助工具2年前074.1K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体综合介绍 MedRAX是一个专为胸部X光片(CXR)分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型,能够动态处理复杂的医学查询,而无需额外训练。MedRAX通过其模块化设计...最新AI资源# AI开源项目# 智能体应用# 视觉目标检测1年前074.1K
LTX Studio:拥有分镜管理工具的AI电影制作平台,可设置多人物保持面部一致综合介绍 LTX Studio 是一个创新的 AI 驱动视频创作平台,专为创作者、营销人员、电影制作人和工作室设计。它提供从故事构思、分镜生成、动效添加到后期编辑的全流程操作,帮助用户将创意概念转化为...最新AI资源# AI换脸与换装# AI文本转视频# 专业生产力工具1年前074K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发,旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...最新AI资源# AI开源项目1年前074K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音综合介绍 YouTube Dubbing 是一个智能配音平台,专为视频创作者和观众提供多语种配音服务。通过AI技术,该平台能够将YouTube视频自动翻译并生成配音,支持多种语言和语音风格。用户只需安...最新AI资源# AI文本转语音2年前074K
通义千问:阿里推出的多模态大模型,拥有文本回答、图片理解、视频解析能力综合介绍 通义千问是阿里云开发的智能大模型,旨在通过深度学习和自然语言处理技术,提供类人的交互体验。它能够快速生成创意文案,增添生活乐趣,作为学习助手,帮助用户轻松学习各类知识。以尖端技术和不断进化的...最新AI资源# AI大模型原生对话工具1年前074K
Quadratic:集成AI对话和代码执行的在线数据分析表格综合介绍 Quadratic 是一个开源的智能电子表格工具,结合了AI、代码和数据连接功能,旨在为用户提供强大的数据处理和分析能力。通过支持Python、SQL和Rust等编程语言,Quadratic...最新AI资源# AI开源项目# AI数据分析1年前074K
Draw A Fish - 免费的在线AI画鱼网站,共享虚拟鱼缸Draw A Fish 是简单而有趣的在线AI画鱼网站,用户可以在上面绘制鱼的图案,将其放入一个全球共享的虚拟鱼缸中。Draw A Fish无需注册,操作简单,只需几秒钟就能完成创作并分享。最新AI资源10个月前074K
Tarsier:生成高质量视频描述的开源视频理解模型综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...最新AI资源# AI开源项目1年前074K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统综合介绍 E2B Open Computer Use 是一个开源项目,旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境,用户可以将其连接到任何大型...最新AI资源# AI开源项目# 桌面自动化智能体1年前074K
Replit Agent:智能编程助手综合介绍 Replit Agent是由Replit公司推出的一款AI编程工具,旨在通过自然语言处理技术帮助用户构建软件项目。用户只需提供简单的指令或问题(Prompt),Replit Agent便能自...最新AI资源# AI编程# 智能体应用1年前073.9K
Morph Studio:用AI创作视频故事|文本转视频|图像转视频综合介绍 Morph Studio 是一个创意和制作工作室,专注于以独特方式结合故事和设计,承接商业广告、动画制作、音乐视频和短片制作项目。此外,Morph Studio 还推出了一个名为“Mor...最新AI资源# AI图像转视频# AI文本转视频2年前073.9K
Fullmoon:本地大语言模型聊天的iOS应用综合介绍 Fullmoon是一款专为iOS设备设计的应用程序,旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon,支持在iPhone、iPad和Mac上运行。用户的聊天...最新AI资源# AI开源项目# AI本地化聊天应用1年前073.9K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型综合介绍 Parler-TTS 是由 Hugging Face 开发的开源文本转语音(TTS)模型库,旨在生成高质量、自然流畅的语音。该模型能够根据输入文本生成具有特定说话人风格(如性别、音调、说话风...最新AI资源# AI开源项目# AI文本转语音1年前073.9K
ChatOn:多功能 AI 聊天与创意工具综合介绍 ChatOn 是一个基于 GPT-4o 和 Claude 3.5 的多功能 AI 平台,提供智能聊天、写作辅助、图像生成和文档处理等功能。用户可以通过文字或语音输入,快速完成任务,如生成社交...最新AI资源# AI集成多模型对话平台1年前073.8K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结综合介绍 Amurex是由The Personal AI Company开发的开源AI会议助手,旨在通过智能化的功能提升会议效率。Amurex能够实时提供建议、生成智能总结、记录会议内容,并自动发送跟...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前073.7K
佐糖:在线图片处理工具,一键抠图、去水印、照片修复、人像编辑综合介绍 佐糖(PicWish)是一款智能AI图像处理平台,提供丰富的在线图片编辑工具,支持全平台使用。用户可以通过佐糖轻松完成一键抠图、去水印、模糊照片变清晰、无损放大、图片裁剪、图片压缩和黑白照片...最新AI资源# AI图像放大与修复# AI图像编辑# AI抠图改背景2年前073.7K
Eightify:用AI快速总结YouTube视频的高效学习助手Eightify 综合介绍 Eightify是一个利用YouTube AI技术,能够在几秒钟内为您提供视频的关键点和总结的工具。无论您是观看商业教育、播客、访谈、新闻还是讲座,Eightify都能帮助...最新AI资源# AI文本与音频/视频总结工具# 浏览器AI助手1年前073.7K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...最新AI资源# AI大模型原生对话工具# AI开源项目2年前073.7K
Prompt Smith:在线轻松管理多版本 Gen AI 提示词综合介绍 Prompt Smith 是一个提示工程解决方案,旨在帮助用户轻松管理生成式 AI 提示。该平台提供了自托管选项,用户可以完全控制自己的数据。通过 Docker 化部署,用户可以轻松启动和运...最新AI资源# PROMPTS辅助工具2年前073.7K
析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI综合介绍 析言GBI是阿里云百炼推出的一款基于大模型的智能数据分析产品。该产品利用先进的自然语言处理技术,帮助用户通过自然语言进行数据查询和分析,无需掌握复杂的SQL语法。析言GBI支持多种数据源,包...最新AI资源# AI数据分析1年前073.7K
Memo AI:视频转字幕、转换多语言字幕的本地客户端综合介绍 MemoAI是一款功能强大的视频翻译工具,专门用于将视频和音频文件转换为文本、字幕和笔记。不论是YouTube视频、播客还是本地文件,MemoAI都能轻松处理。支持中、英、日等90多种语言的...最新AI资源# AI文本转语音# AI语音转文本# AI音视频编辑2年前073.7K
阿里妈妈创意中心:淘宝生态下的智能化营销创意支持平台综合介绍 阿里妈妈创意中心是阿里巴巴旗下的智能化营销创意支持平台,专为淘宝、天猫等电商平台的商家提供从图文到视频再到落地页的全方位创意支持。通过结合AI智能文案能力和海量模板,创意中心大幅提升了设计效...最新AI资源# AI营销2年前073.7K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容综合介绍 Voicenotes 是一款智能语音笔记应用,旨在帮助用户轻松记录和管理语音笔记及会议内容。该应用支持100多种语言的语音转录,用户只需说出想法,Voicenotes 即可自动将其转录为文字...最新AI资源# AI笔记# AI语音转文本1年前073.7K
TattooAI:AI纹身图片设计生成器,在线设计个性化纹身综合介绍 TattooAI.design 是一个基于人工智能的在线纹身设计平台。用户只需输入自己的纹身创意,AI就能在几秒钟内生成独特的纹身设计。无论是黑白纹身还是彩色纹身,TattooAI.desi...最新AI资源# AI图像风格控制2年前073.7K
Free Public APIs:为AI赋能的200+免费公共API集合综合介绍 FreePublicAPIs 是一个专为学生和开发者设计的网站,提供了一个集合了137个免费公共API的平台。这些API涵盖了从天气预报到社交媒体数据等各种领域,帮助用户在项目中轻松集成和使...最新AI资源# AI开放服务2年前073.7K
SegAnyMo:从视频中自动分割任意运动物体的开源工具综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新AI资源# AI开源项目# AI抠图改背景# 视觉目标检测1年前073.7K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具综合介绍 MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。MM...最新AI资源# AI开源项目# AI音乐2年前073.7K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash(实验性)模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互,提供实时低延迟的用...最新AI资源# AI开源项目# 多模态实时互动产品1年前073.6K
RolmOCR:识别手写和倾斜字符的文档OCR模型综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别(OCR)工具,基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字,速度比同类工具...最新AI资源# AI开源项目# OCR1年前073.6K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具综合介绍 Proxy Lite 是由 Convergence AI 开发的一款开源、轻量级网页自动化工具,作为 Proxy 的迷你版,采用开放权重设计。它基于 3B参数的视觉语言模型(VLM),能够自...最新AI资源# AI开源项目# 桌面自动化智能体1年前073.6K
Narakeet - AI文本转语音平台,支持生成多语言音频Narakeet是强大的AI文本转语音平台,基于自然语音合成技术,支持将文本、Word文档、PPT演示文稿或字幕文件快速转换为高质量音频,支持与视频内容自动同步。最新AI资源1年前073.6K
Petals:分布式共享GPU运行和微调大语言模型,像BitTorrent网络一样共享GPU资源综合介绍 Petals 是一个由 BigScience Workshop 开发的开源项目,旨在通过分布式计算的方式运行大型语言模型(LLMs)。用户可以在家中使用消费级 GPU 或 Google Co...最新AI资源# 大模型微调# 本地部署开源大模型工具2年前073.5K
Midreal AI:互动式AI文字冒险游戏和幻想小说创作综合介绍 Midreal AI通过引人入胜的启发式对话进行文本冒险游戏,特点是采用尖端的AI技术为玩家提供沉浸式叙事体验。玩家可以自行设定场景进行探索,并在游戏中体验多样化的叙事线路。这个平台特别适合...最新AI资源# AI写作# AI角色扮演2年前073.5K
DH live:在30/40系显卡流畅实时交互的AI数字人综合介绍 DH_live 是一个基于少样本学习的实时直播数字人项目,旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡,能够以 25+ fps 的速度实时运行。用户可...最新AI资源# AI开源项目# AI数字人2年前073.5K
They See Your Photos:基于 Google Vision 照片隐私信息分析综合介绍 They See Your Photos 是一个简单易用的在线工具,旨在帮助用户了解照片中隐藏的隐私信息。用户可以上传任意图片,网站通过人工智能技术分析图像内容和元数据,展示照片可能泄露的细...最新AI资源# AI图像生成辅助工具1年前073.4K
Jaaz - 开源AI设计Agent,本地免费 Lovart 平替项目Jaaz 是开源的AI设计Agent,本地免费 Lovart 平替项目。具备强大的 AI 设计能力,能智能生成设计提示,批量生成图像、海报、故事板等。Jaaz 支持 Ollama、Stable Dif...最新AI资源1年前073.4K
ClipZap AI换脸工具:快速实现照片和视频的AI换脸(免费)综合介绍 ClipZap AI换脸工具 是一个领先的AI换脸工具,专为照片和视频的换脸需求而设计。该网站利用先进的人工智能技术,自动识别视频和图像中的人物,并进行高质量的面部替换。无论是创建有趣的表情...最新AI资源# AI视频换脸1年前073.4K
FinChat:智能股票研究平台,美股公开财报分析综合介绍 FinChat 是一个由人工智能驱动的股票研究平台,专为投资者提供高质量的财务数据和分析工具。通过整合750多家公司的数据和100多位超级投资者的投资信息,FinChat 帮助用户快速获取市...最新AI资源# AI金融数据分析1年前073.4K
AI Engineer Pack:AI开发者的“免费大礼包”!赠送主流AI工具兑换码想象一下,你是个AI开发者,手握一堆绝妙点子,却被高昂的工具费用卡得死死的。现在,这一切要翻篇了!ElevenLabs祭出的AI Engineer Pack 横空出世,直接把“开发成本”这个拦路虎按在...最新AI资源# AI开放服务# 免费大模型API1年前073.4K
ToolJet:使用文字描述快速构建和部署企业内部应用程序综合介绍 ToolJet 是一个由 AI 驱动的企业应用开发平台,通过简单的自然语言描述即可创建自定义 AI 应用和代理。用户只需描述所需的应用,ToolJet 即可完成 UI、数据库和查询等所有设置...最新AI资源# 无代码开发1年前073.3K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码综合介绍 AIDE(AI-assisted Development Extension)是一款强大的 VSCode AI 辅助开发扩展,专注于提供独特且实用的 AI 编程辅助功能。它不同于 GitHu...最新AI资源# AI开源项目# AI编程1年前073.3K
Zuni:读取网页内容提供帮助的侧边栏AI助手综合介绍 Zuni是一款Chrome浏览器侧边栏的AI助手,旨在通过实时分析网页和整合Gmail功能提升用户效率。它由Old House Labs, Inc.开发,2024年由George Seabr...最新AI资源# 浏览器AI助手1年前073.3K
Dzine:可控的AI图像生成功能与画布设计工具,提供数百种图像风格样式综合介绍 Dzine(前身为Stylar)是一个全能的AI设计平台,提供从图像生成到编辑的一体化工作流程,无与伦比的图像构图和风格控制功能。其预定义风格让所有技能层次的用户都能轻松地定制设计,无需复杂...最新AI资源# AI图像风格控制# AI在线生成图像# AI画布2年前073.3K
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用综合介绍 AR Drawing 是一款利用增强现实(AR)技术帮助用户提升绘画技能的应用。该应用提供超过200个逐步指导的绘画课程,涵盖从初学者到高级水平的各种绘画模板。用户可以通过手机摄像头将图像投...最新AI资源# AI开放服务2年前073.3K
QuillBot:智能辅助改写与校对文本的写作工具综合介绍 QuillBot 是一个基于人工智能的在线写作辅助平台,旨在帮助用户快速改写、校对和优化文本内容。它通过自然语言处理技术,提供文本改写、语法检查、文本总结和翻译等功能,适合学生、职场人士和内...最新AI资源# AI写作# 浏览器AI助手1年前073.3K
TinyWow:免费使用多功能写作与图像在线编辑工具综合介绍 TinyWow 是一个综合性的在线平台,提供多种免费的数字工具,旨在简化用户的数字生活。无论是 PDF 管理、视频编辑、图片处理,还是 AI 驱动的写作辅助,TinyWow 都能满足用户的需...最新AI资源# AI写作# AI图像生成辅助工具# AI图像编辑1年前073.2K
dots.ocr - 小红书hi lab推出的开源多语言文档解析模型dots.ocr是小红书hi lab开源的多语言文档解析模型,基于17亿参数的视觉语言模型(VLM),能高效地进行文档布局检测和内容识别,同时保持良好的阅读顺序。最新AI资源11个月前073.2K
DeepRant:实时翻译游戏聊天内容的开源客户端综合介绍 DeepRant 是一款专为游戏玩家打造的开源翻译工具,旨在解决国际服务器中语言不通的问题。它通过快捷键实现游戏内文字的即时翻译,支持多种语言互译,让玩家无需退出游戏即可快速理解和回复聊天信...最新AI资源# AI开源项目# AI翻译1年前073.2K
Consensus:优秀的学术论文搜索引擎综合介绍 Consensus是一个利用AI技术来寻找和总结科学研究论文的搜索引擎。通过该平台,用户可以提出各种问题,例如“肌酸能否帮助增肌?”或“正念冥想能改善睡眠吗?”并从超过2亿篇科学论文中获取洞...最新AI资源# AI搜索工具# AI教育工具# 论文2年前073.2K
AgentGPT:创建并运行自动化AI智能体的开源项目综合介绍 AgentGPT 是一个由 Reworkd 团队开发的开源项目,托管在 GitHub 上,旨在让用户通过浏览器自主创建、配置和部署 AI 智能体。用户只需设定一个目标,AgentGPT 就能...最新AI资源# AI开源项目# 智能体开发框架1年前073.2K
OhMyGPT:免费使用GPT-3.5-16k和各类大模型转发APIOhMyGPT 可以让你便捷地无限量访问GPT-3.5-turbo、GPT-3.5-turbo-16k、GPT-4、GPT-4-32k、DALL-E、whisper、MidJourney等先进的AI模...最新AI资源# AI开放服务# AI集成多模型对话平台2年前073.2K
iFoto.AI:智能AI照片编辑器|免费图像去背景|模特换装|换脸iFoto 综合介绍 ifoto是一个免费在线AI照片编辑工具,专为电子商务设计,提供了一系列功能来提升在线产品展示。它通过AI技术将服装模特转化为逼真的模特,并为产品提供多样化的真实场景背景。ifo...最新AI资源# AI抠图改背景# AI换脸与换装2年前073.2K
Whispers from the Star:米哈游开发的AI实时互动科幻故事游戏综合介绍 “Whispers from the Star”(群星低语)是Anuttacon公司开发的一款实时互动科幻故事游戏。这款游戏由米哈游创始人蔡浩宇创立的Anuttacon推出,设定在深空,玩家...最新AI资源# AI角色扮演1年前073.1K
xyks:小猿口算逆向笔记,逆向工程与解密算法综合介绍 小猿口算逆向笔记是一个开源项目,旨在记录和分享对小猿口算应用进行逆向工程的过程和方法。该项目包含了多种逆向工具和技术的使用说明,如Frida、dexdump等,帮助用户了解和破解小猿口算的加...最新AI资源# AI开源项目# AI教育工具2年前073.1K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化综合介绍 Eko 是一个生产级的 JavaScript 框架,旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下,利用AI技术自动化日常任务。Eko提供了一个统...最新AI资源# AI开源项目# 低代码工作流# 智能体应用1年前073.1K
R1-V:低成本强化学习实现视觉语言模型泛化能力综合介绍 R1-V 是一个开源项目,旨在通过低成本的强化学习(RL)实现视觉语言模型(VLM)的突破。该项目利用可验证的奖励机制,激励 VLMs 学习通用的计数能力。令人惊叹的是,R1-V 的 2B ...最新AI资源# AI开源项目1年前073.1K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术,能够自动识别和修复图像中的缺陷,同时支持用户进行交互式编辑。BrushEdit 结合了多种...最新AI资源# AI图像编辑# AI开源项目2年前073.1K
Pika:优秀的创意视频生成|文生视频|图生视频|图像视频融合Pika综合介绍 Pika.art是一个将想法转化成视频的平台,旨在提供给创意人士一个AI视频创作的工具。无论是想制作搞笑的短片、社交媒体内容还是短电影,Pika.art能跟随用户的想象力来创作。用户...最新AI资源# AI图像转视频# AI文本转视频1年前073K
Weebo:实时语音聊天机器人,提供自然语言对话体验综合介绍 Weebo 是一个开源的实时语音聊天机器人,利用 Whisper Small 进行语音识别,Llama 3.2 进行自然语言生成,以及 Kokoro-82M 进行语音合成。该项目由 Aman...最新AI资源# AI开源项目# 多模态实时互动产品1年前073K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成综合介绍 Infinity是一个开创性的高分辨率图像生成框架,由FoundationVision团队开发。该项目通过创新的位级视觉自回归建模方法,突破了传统图像生成模型的限制。Infinity的核心特...最新AI资源# AI在线生成图像# AI开源项目1年前073K
GeekAI:自部署商业化多功能AI助手,完整接入多模型API运营后台综合介绍 GeekAI是一个基于AI大语言模型API实现的AI助手全套开源解决方案。该项目自带运营管理后台,开箱即用,集成了ChatGPT, Azure, ChatGLM, 讯飞星火,文心一言等多个平...最新AI资源# AI副业赚钱项目# AI本地化聊天应用2年前073K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制综合介绍 Ruyi-Models 是一个开源项目,旨在通过图像生成高质量的视频。该项目由 IamCreateAI 团队开发,支持生成 768 分辨率、每秒 24 帧、总计 5 秒 120 帧的电影级视...最新AI资源# AI图像转视频# AI开源项目2年前073K
CogVLM2:开源多模态模型,支持视频理解与多轮对话综合介绍 CogVLM2 是由清华大学数据挖掘研究组(THUDM)开发的开源多模态模型,基于 Llama3-8B 架构,旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...最新AI资源# AI开源项目# 视觉目标检测1年前073K
Descript:一站式视频与播客编辑,简单如编辑文档Descript 综合介绍 Descript是一款强大又简便的视频及播客编辑工具。它拥有行业领先的转录精度和速度以及强大的校正工具,还能通过AI技术将视频转录为文本,并通过编辑文本的方式来编辑视频。除...最新AI资源# AI文本转语音# AI音视频编辑2年前073K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格综合介绍 YuE是一个开源的全歌曲生成基础模型,专注于将歌词转化为完整的歌曲。与其他仅能生成短片段非声乐音乐的模型不同,YuE能够生成包含主唱和伴奏的完整歌曲,时长可达数分钟。该模型解决了音乐生成中的...最新AI资源# AI开源项目# AI音乐1年前072.9K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成综合介绍 ConsisID 是由北京大学袁粒课题组开发的一个开源项目,旨在通过频率分解技术实现身份一致的文本到视频生成(IPT2V)。该项目的核心是一个基于DiT(Diffusion Transfor...最新AI资源# AI开源项目# AI文本转视频2年前072.9K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)综合介绍 FlashMLA 是由 DeepSeek AI 开发的一款高效 MLA(Multi-head Latent Attention)解码内核,专为 NVIDIA Hopper 架构 GPU 优化...最新AI资源# AI开源项目1年前072.9K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)综合介绍 Diffusers Image Outpaint 是由 Hugging Face 社区成员 fffiloni 创建的一个强大的 AI 图像扩展工具。该工具利用先进的扩散模型技术,可以将图像进...最新AI资源# AI图像放大与修复# AI开源项目2年前072.9K
法行宝:AI法律顾问,人工智能法律咨询,百度AI法律平台综合介绍 法行宝 是百度公司推出的智能法律服务平台,融合了先进的人工智能技术与专业的法律知识库。该平台致力于为用户提供便捷、专业的法律智能服务,包括智能法律问答、案例分析、合同审查等功能。通过深度学习...最新AI资源# AI客服机器人1年前072.8K
PSHuman:生成逼真3D人像模型,使用一张照片生成3D人建模综合介绍 PSHuman是一个基于多视图扩散技术的单图像3D人像重建工具。该工具能够从单张穿衣人像照片生成详细的几何结构和逼真的3D人像模型。PSHuman的核心技术包括跨尺度多视图扩散,能够在短时间...最新AI资源# AI文本与图片转3D2年前072.8K
Chatwise:共享知识变成收入的AI聊天机器人综合介绍 Chatwise 是一个简单实用的平台,专门帮助用户把知识变成能赚钱的AI聊天机器人。你只需要上传文件、文章或链接,网站就会快速生成一个智能机器人,别人可以通过付费订阅来学习你的内容,你则能...最新AI资源# AI副业赚钱项目1年前072.8K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具综合介绍 “Vocabulary Book by DeepSeek”是一个基于DeepSeek大模型开发的开源项目,旨在帮助英语学习者高效掌握大学英语四级(CET-4)词汇。项目托管在GitHub上...最新AI资源# AI开源项目# AI教育工具1年前072.8K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)综合介绍 LunaAI换脸小程序是一个基于uniapp和Vue框架开发的换脸应用。该应用利用了PHP、MySQL、Nginx和Redis等技术,实现了用户通过小程序进行换脸操作的功能。用户可以通过该小...最新AI资源# AI副业赚钱项目# AI开放服务# AI换脸与换装2年前072.8K
Same:克隆网站UI生成生产级前端代码综合介绍 Same 是一个简单实用的在线工具,专门为设计师和开发者提供快速复制网页界面的功能。它通过输入网址,就能生成与目标网页像素级一致的设计稿,帮助用户省去手动重绘的时间。这个网站的核心在于“复制...最新AI资源# AI页面设计1年前072.8K
Interviewcoder:辅助远程技术面试的隐形AI工具综合介绍 Interviewcoder 是一款专为技术面试设计的AI辅助工具,旨在帮助用户在编程面试中快速生成解决方案、优化代码并实时调试。它通过隐形桌面应用的形式运行,用户可以在Zoom、Googl...最新AI资源# AI生活效率助手1年前072.8K
VideoFX(Veo2):AI生成创意视频,高物理状态还原,输出原生4K视频综合介绍 VideoFX是Google实验室推出的一款创新视频生成工具,旨在帮助用户轻松创建富有创意和视觉冲击力的视频内容。该工具利用先进的Veo 2.0技术,提供多种视频特效和编辑功能,适合各种创意...最新AI资源# AI文本转视频2年前072.8K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图...最新AI资源# AI开源项目# 文档提取与清洗2年前072.8K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品综合介绍 Whisk是Google Labs推出的一款创新型AI图像生成工具,旨在通过上传多张图片来混合不同的主题、场景和风格。与传统的依赖文本提示的图像生成工具不同,Whisk主要使用图像作为输入...最新AI资源# AI图像风格控制1年前072.8K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频综合介绍 Easegen 是一个开源的数字人课程制作平台,旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案,用户可以创建数字人讲解的视频课程...最新AI资源# AI开源项目# AI教育工具# AI文本转视频2年前072.8K
mcp-ui:基于MCP协议的简洁AI聊天界面综合介绍 mcp-ui 是一个开源项目,由开发者 machaojin1917939763 创建,基于 Model Context Protocol(MCP)协议打造,是一款支持 Web 和桌面环境的智...最新AI资源# AI开源项目# AI本地化聊天应用1年前072.8K
飞书知识问答:使用飞书文档作为AI知识库综合介绍 飞书知识问答 是飞书推出的一款AI驱动的知识管理与问答工具,深度集成了DeepSeek R1大模型技术。它支持实时联网搜索、多格式文件解析(包括文档、图片等),并能无缝对接企业知识库,帮助用...最新AI资源# 知识检索与RAG框架1年前072.8K
Tough Tongue AI:与AI对话练习面试与职场沟通技巧综合介绍 Tough Tongue AI 是一个专为练习艰难对话而设计的人工智能平台。用户可以通过选择预设场景或创建自定义场景,模拟各种复杂的对话情境,如工作面试、薪资谈判、销售演示等。平台提供视频和...最新AI资源# AI生活效率助手1年前072.8K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库,专门收集和展示各种优秀的LLM(大语言模型)应用程序。该仓库包含了使用 OpenAI、An...最新AI资源# AI开源项目2年前072.8K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。综合介绍 Ant Design X是蚂蚁集团开源的一个工具包,旨在帮助开发者快速构建AI驱动的对话界面。它提供了丰富的组件和模板,支持与OpenAI标准兼容的模型集成,适用于智能客服、AI助手等多种应...最新AI资源# AI开源项目2年前072.8K
ModelsLab:AI图像生成为主的API服务商|免费体验1000+模型综合介绍 ModelsLab 是一个提供多种AI生成工具的平台,专注于将文本转化为图像、视频、音频和3D模型。该平台为开发者和企业提供强大的API服务,使他们能够轻松创建和集成AI生成的内容。Mode...最新AI资源# AI自部署图像生成工具2年前072.7K
HeroUI Chat:将网页设计转为React代码的AI工具综合介绍 HeroUI Chat 是一个基于人工智能的在线平台。它能帮助用户通过简单的文字描述或上传截图,快速生成漂亮且可直接用于生产环境的 React 代码。这个工具依托于开源的 HeroUI 组件...最新AI资源# AI编程1年前072.6K
Diagramming AI:使用AI在线设计UML图和工作流程图综合介绍 Diagramming AI 是一个强大的在线工具,利用人工智能技术帮助用户即时设计和编辑UML图和工作流程图。该网站提供了多种图表格式,包括流程图、序列图和甘特图等,用户只需输入文本即可生...最新AI资源# AI白板与信息图1年前072.6K
OpenManus-RL:微调大模型强化智能体推理与决策能力综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM...最新AI资源# AI开源项目# 大模型微调1年前072.6K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离综合介绍 XAudioPro 是一款先进的在线音频实时剪辑和转码工具,兼具专业化与便携化。支持剪切、裁剪、复制、删除、恢复、振幅增益控制等专业音频编辑功能。它还提供了去噪服务,如频谱减法噪声减少、低通...最新AI资源# AI文本转语音# AI音视频编辑2年前072.6K
Mebot:支持长期记忆多类文档的全终端个人AI助手(推荐)综合介绍 Me.bot 是一款专为日常生活打造的个人 AI 助手。它就像你的第二个大脑,帮助你整理记忆、激发创造力并放大你的想法。Me.bot 由自主研发的强大个人模型驱动,通过先进的加密和隐私功能确...最新AI资源# AI笔记2年前072.6K
LightLLM:高效的轻量级大语言模型推理和服务框架综合介绍 LightLLM 是一个基于 Python 的大语言模型(LLM)推理和服务框架,以其轻量级设计、易于扩展和高效性能而著称。该框架利用了多种知名的开源实现,包括 FasterTransfor...最新AI资源# 本地部署开源大模型工具1年前072.6K
WeaveFox:前端智能研发平台,能够根据设计图直接生成源代码综合介绍 WeaveFox是蚂蚁集团推出的AI前端智能研发平台,旨在通过AI技术提升前端开发的效率和质量。该平台基于蚂蚁自研的百灵多模态大模型,能够根据设计图直接生成前端源代码,支持多种客户端和技术栈...最新AI资源# AI页面设计2年前072.5K
Orate:集成知名语音生成、语音转录与变声模型的统一API综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本1年前072.5K
SongGeneration - 腾讯AI实验室推出的音乐生成模型SongGeneration 是腾讯 AI 实验室推出的高质量歌曲生成项目。基于 LeLM(Large Language Model for Music)框架,能并行生成人声与伴奏,实现二者和谐统一...最新AI资源12个月前072.5K
OWL:多智能体协作完成现实任务的自动化工具综合介绍 OWL(Optimized Workforce Learning)是由 CAMEL-AI 团队开发的一个开源框架,专注于优化多智能体协作以实现真实世界任务的自动化。基于 CAMEL-AI 架...最新AI资源# AI开源项目# 智能体开发框架1年前072.5K
Petal:使用AI分析和管理文档,检索多文档生成有据可查的答案综合介绍 Petal 是一个基于人工智能的文档分析平台,旨在帮助用户高效管理和分析文档。通过 Petal,用户可以将自己的知识库链接到平台上,生成完全有据可查且可靠的答案。Petal 支持多种文档类型...最新AI资源# AI写作# 知识检索与RAG框架1年前072.5K