Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)综合介绍 Diffusers Image Outpaint 是由 Hugging Face 社区成员 fffiloni 创建的一个强大的 AI 图像扩展工具。该工具利用先进的扩散模型技术,可以将图像进...最新AI资源# AI图像放大与修复# AI开源项目2年前070.5K
Morphik Core:处理多模态数据的开源 RAG 平台综合介绍 Morphik Core 是一个开源项目,由 morphik-org 团队开发,托管在 GitHub 上。它以前叫 DataBridge Core,现在更名为 Morphik Core。这个...最新AI资源# AI开源项目# 知识检索与RAG框架1年前070.4K
Tempo Labs:使用AI快速构建React应用,多职能协作的React可视化编辑器综合介绍 Tempo Labs 是一个利用人工智能技术帮助开发者和设计师快速构建React应用的平台。该平台通过提供直观的拖放编辑器和丰富的组件库,使用户能够轻松设计和开发高质量的用户界面。Tempo...最新AI资源# AI页面设计1年前070.4K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash(实验性)模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互,提供实时低延迟的用...最新AI资源# AI开源项目# 多模态实时互动产品1年前070.4K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图...最新AI资源# AI开源项目# 文档提取与清洗1年前070.3K
TinyWow:免费使用多功能写作与图像在线编辑工具综合介绍 TinyWow 是一个综合性的在线平台,提供多种免费的数字工具,旨在简化用户的数字生活。无论是 PDF 管理、视频编辑、图片处理,还是 AI 驱动的写作辅助,TinyWow 都能满足用户的需...最新AI资源# AI写作# AI图像生成辅助工具# AI图像编辑1年前070.3K
LTX Studio:拥有分镜管理工具的AI电影制作平台,可设置多人物保持面部一致综合介绍 LTX Studio 是一个创新的 AI 驱动视频创作平台,专为创作者、营销人员、电影制作人和工作室设计。它提供从故事构思、分镜生成、动效添加到后期编辑的全流程操作,帮助用户将创意概念转化为...最新AI资源# AI换脸与换装# AI文本转视频# 专业生产力工具1年前070.3K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo综合介绍 LogoCreator是一个基于Together AI和Flux模型的开源Logo生成器,专注于为企业和个人提供快速、专业的Logo设计服务。该项目由开发者Nutlope开发并开源,在Git...最新AI资源# AI图像风格控制# AI开源项目1年前070.3K
Reshot AI:实时编辑面部表情,人像图片面部表情精细控制综合介绍 Reshot AI 是一款功能强大的在线 AI 照片编辑器,专注于面部表情、眼睛方向和头部姿势的实时调整。用户可以通过简单的操作,快速编辑和增强照片,生成高质量的专业照片。Reshot AI...最新AI资源# AI图像风格控制1年前070.3K
Morph Studio:用AI创作视频故事|文本转视频|图像转视频综合介绍 Morph Studio 是一个创意和制作工作室,专注于以独特方式结合故事和设计,承接商业广告、动画制作、音乐视频和短片制作项目。此外,Morph Studio 还推出了一个名为“Mor...最新AI资源# AI图像转视频# AI文本转视频2年前070.3K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)综合介绍 Datalab 提供了一系列先进的AI模型,专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越,而且易于使用,并且是开源的。平台上的Marker模型可以快速准确地将...最新AI资源# AI开放服务# AI开源项目# OCR1年前070.3K
Tarsier:生成高质量视频描述的开源视频理解模型综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...最新AI资源# AI开源项目1年前070.2K
AI Engineer Pack:AI开发者的“免费大礼包”!赠送主流AI工具兑换码想象一下,你是个AI开发者,手握一堆绝妙点子,却被高昂的工具费用卡得死死的。现在,这一切要翻篇了!ElevenLabs祭出的AI Engineer Pack 横空出世,直接把“开发成本”这个拦路虎按在...最新AI资源# AI开放服务# 免费大模型API1年前070.2K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型综合介绍 ModelBest 是一家专注于开发轻量高性能大模型的公司,致力于将先进的 AI 技术应用于日常生活中的主流消费电子和各类终端设备。其 MiniCPM 系列端侧模型以极致的算力和内存使用效率...最新AI资源# AI大模型原生对话工具# AI开源项目2年前070.2K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用综合介绍 Ai2 OLMoE是由Allen Institute for AI(简称Ai2,艾伦人工智能研究所)开发的一款开源iOS应用,旨在提供完全在设备上运行的AI模型。该应用利用了Ai2的开源OL...最新AI资源# AI大模型原生对话工具# AI开源项目# AI本地化聊天应用1年前070.2K
PSHuman:生成逼真3D人像模型,使用一张照片生成3D人建模综合介绍 PSHuman是一个基于多视图扩散技术的单图像3D人像重建工具。该工具能够从单张穿衣人像照片生成详细的几何结构和逼真的3D人像模型。PSHuman的核心技术包括跨尺度多视图扩散,能够在短时间...最新AI资源# AI文本与图片转3D1年前070.2K
HyperBooth AI:用一张自拍照快速生成不同风格照片综合介绍 HyperBooth AI是一个能够让用户通过上传自拍照片即刻生成不同风格AI照片的服务平台。用户可以选择超过200种预设风格,创造出个性化的艺术图像。这个平台特有的生成器提供了高仿真度和创...最新AI资源# AI图像风格控制# AI换脸与换装2年前070.2K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具综合介绍 LazyLLM 是由 LazyAGI 团队开发的一款开源工具,专注于简化多智能体大模型应用的开发流程。它通过一键部署和轻量级网关机制,帮助开发者快速搭建复杂的 AI 应用,节省繁琐的工程配置...最新AI资源# AI开源项目# 智能体开发框架1年前070.2K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)综合介绍 LunaAI换脸小程序是一个基于uniapp和Vue框架开发的换脸应用。该应用利用了PHP、MySQL、Nginx和Redis等技术,实现了用户通过小程序进行换脸操作的功能。用户可以通过该小...最新AI资源# AI副业赚钱项目# AI开放服务# AI换脸与换装1年前070.2K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...最新AI资源# AI开源项目# 桌面自动化智能体1年前070.2K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...最新AI资源# AI大模型原生对话工具# AI开源项目1年前070.1K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字综合介绍 录咖是一站式音视频处理平台,提供AI视频对话、AI字幕和AI语音转文字服务。功能包括录制屏幕、剪辑视频、转换GIF/音频等,并支持云存储与分享。界面直观,使用方便,还支持多屏幕录制和多语种智...最新AI资源# AI文本转视频# AI文本转语音# AI语音转文本1年前070.1K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制综合介绍 Ruyi-Models 是一个开源项目,旨在通过图像生成高质量的视频。该项目由 IamCreateAI 团队开发,支持生成 768 分辨率、每秒 24 帧、总计 5 秒 120 帧的电影级视...最新AI资源# AI图像转视频# AI开源项目1年前070.1K
StudyX:AI驱动的作业解答与学习助手综合介绍 StudyX 是一个为学生和终身学习者设计的 AI 学习平台,专注于提供快速、准确的作业解答和学习资源。它支持数学、物理、化学、文学等多个学科,用户可以通过文字、拍照或公式输入问题,获取详细...最新AI资源# AI教育工具1年前070K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发,旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...最新AI资源# AI开源项目1年前070K
秘塔AI搜索:提供无广告的高效学术搜索服务,研究模式深度挖掘知识综合介绍 秘塔AI搜索是一家致力于通过人工智能技术提升生产力的科技公司。该网站提供无广告的高效学术搜索服务,旨在为用户提供精准、快速的搜索结果。秘塔AI搜索拥有自主研发的大语言模型MetaLLM,能够...最新AI资源# AI搜索工具1年前070K
Memo AI:视频转字幕、转换多语言字幕的本地客户端综合介绍 MemoAI是一款功能强大的视频翻译工具,专门用于将视频和音频文件转换为文本、字幕和笔记。不论是YouTube视频、播客还是本地文件,MemoAI都能轻松处理。支持中、英、日等90多种语言的...最新AI资源# AI文本转语音# AI语音转文本# AI音视频编辑1年前070K
Vsub:输入文字或模板生成无需露脸的病毒营销视频综合介绍 Vsub 是一个专注于自动化视频内容制作的平台,旨在帮助内容创作者快速生成无脸视频(faceless videos)。它利用人工智能技术,允许用户通过输入文本或选择预设模板来创建适合YouT...最新AI资源# AI营销# AI视频生成工具1年前069.9K
火山方舟:大模型训练与云计算服务,注册送150元等额算力综合介绍 火山方舟 是火山引擎推出的一款专注于大模型服务的云计算平台,旨在为企业提供从模型选择、训练到应用的完整解决方案。依托字节跳动在AI领域的深厚积累,火山方舟整合了多家顶级AI公司的大模型资源...最新AI资源# AI开放服务1年前069.9K
DiffusionBee:专为macOS用户设计的Stable Diffusion本地运行工具箱综合介绍 DiffusionBee 是一款功能强大的 AI 艺术生成工具,专为 macOS 用户设计。它利用 Stable Diffusion 模型,允许用户通过简单的文本提示生成高质量的图像。Dif...最新AI资源# AI自部署图像生成工具1年前069.9K
通义千问:阿里推出的多模态大模型,拥有文本回答、图片理解、视频解析能力综合介绍 通义千问是阿里云开发的智能大模型,旨在通过深度学习和自然语言处理技术,提供类人的交互体验。它能够快速生成创意文案,增添生活乐趣,作为学习助手,帮助用户轻松学习各类知识。以尖端技术和不断进化的...最新AI资源# AI大模型原生对话工具1年前069.8K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码综合介绍 AIDE(AI-assisted Development Extension)是一款强大的 VSCode AI 辅助开发扩展,专注于提供独特且实用的 AI 编程辅助功能。它不同于 GitHu...最新AI资源# AI开源项目# AI编程1年前069.8K
dots.ocr - 小红书hi lab推出的开源多语言文档解析模型dots.ocr是小红书hi lab开源的多语言文档解析模型,基于17亿参数的视觉语言模型(VLM),能高效地进行文档布局检测和内容识别,同时保持良好的阅读顺序。最新AI资源9个月前069.8K
Anifusion - AI漫画和动漫图片制作平台,文本描述生成漫画页面和角色图像Anifusion是在线AI漫画和动漫图片制作平台,基于AI技术,帮助创作者无需绘画技能制作出专业级别的漫画和动漫艺术作品。用户只需输入描述性提示,AI能自动生成漫画页面和角色图像。平台提供直观的布局...最新AI资源11个月前069.8K
Gemini Playground:无服务器部署Gemini多模态对话网站综合介绍 Gemini Playground 是一个开源项目,旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发,支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身...最新AI资源# AI开源项目# 免费大模型API1年前069.8K
析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI综合介绍 析言GBI是阿里云百炼推出的一款基于大模型的智能数据分析产品。该产品利用先进的自然语言处理技术,帮助用户通过自然语言进行数据查询和分析,无需掌握复杂的SQL语法。析言GBI支持多种数据源,包...最新AI资源# AI数据分析1年前069.8K
Mebot:支持长期记忆多类文档的全终端个人AI助手(推荐)综合介绍 Me.bot 是一款专为日常生活打造的个人 AI 助手。它就像你的第二个大脑,帮助你整理记忆、激发创造力并放大你的想法。Me.bot 由自主研发的强大个人模型驱动,通过先进的加密和隐私功能确...最新AI资源# AI笔记1年前069.8K
Heeyo:陪伴孩子的AI伴侣,提升儿童学习体验的智能AI伙伴(付费)综合介绍 Heeyo是一款专为3-11岁儿童设计的AI应用,旨在通过互动游戏和对话提升孩子的学习体验。Heeyo由哈佛和斯坦福的教育专家设计,提供2000+学习游戏,涵盖数学、科学和社交情感技能。孩子...最新AI资源# AI教育工具1年前069.8K
Dream Interpreter AI:免费AI解梦,梦境解析,理解潜意识思维。综合介绍 Dream Interpreter AI 是一个利用人工智能技术帮助用户解析和理解梦境的平台。通过先进的AI算法和广泛的梦境符号数据库,用户可以获得个性化的梦境解读和视觉化呈现。平台提供免费...最新AI资源# AI角色扮演1年前069.7K
Interviewcoder:辅助远程技术面试的隐形AI工具综合介绍 Interviewcoder 是一款专为技术面试设计的AI辅助工具,旨在帮助用户在编程面试中快速生成解决方案、优化代码并实时调试。它通过隐形桌面应用的形式运行,用户可以在Zoom、Googl...最新AI资源# AI生活效率助手1年前069.7K
使用Cursor读取并修改Figma设计稿的MCP服务综合介绍 Cursor Talk to Figma MCP 是一个开源项目,通过 Model Context Protocol (MCP) 协议连接 AI 编程工具 Cursor 和设计软件 Figm...最新AI资源# AI开源项目# AI页面设计# MCP服务1年前069.7K
Fullmoon:本地大语言模型聊天的iOS应用综合介绍 Fullmoon是一款专为iOS设备设计的应用程序,旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon,支持在iPhone、iPad和Mac上运行。用户的聊天...最新AI资源# AI开源项目# AI本地化聊天应用1年前069.6K
Jaaz - 开源AI设计Agent,本地免费 Lovart 平替项目Jaaz 是开源的AI设计Agent,本地免费 Lovart 平替项目。具备强大的 AI 设计能力,能智能生成设计提示,批量生成图像、海报、故事板等。Jaaz 支持 Ollama、Stable Dif...最新AI资源11个月前069.6K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库,专门收集和展示各种优秀的LLM(大语言模型)应用程序。该仓库包含了使用 OpenAI、An...最新AI资源# AI开源项目1年前069.6K
UserAPI.ai:集成Midjourney图像生成API接口综合介绍 UserAPI.ai 是一个为开发者设计的API服务平台,专注于连接Midjourney的图像生成功能。用户通过简单的接口调用,就能生成高质量的AI图像,无需直接操作Midjourney的复...最新AI资源# AI开放服务1年前069.6K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具综合介绍 AnimeGamer 是腾讯 ARC 实验室推出的一个开源工具。用户可以用简单的语言指令,比如“宗介开紫色车兜风”,生成动漫视频,还能让不同动漫角色互动,比如《魔女宅急便》的琪琪和《天空之城...最新AI资源# AI开源项目# AI视频生成工具# AI视频转换风格1年前069.6K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)综合介绍 FlashMLA 是由 DeepSeek AI 开发的一款高效 MLA(Multi-head Latent Attention)解码内核,专为 NVIDIA Hopper 架构 GPU 优化...最新AI资源# AI开源项目1年前069.5K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具综合介绍 VideoLingo 是一个一站式视频翻译和本地化配音工具,旨在生成 Netflix 级别的高质量字幕,消除生硬的机器翻译和多行字幕,并添加高质量的配音,使全球知识能够跨越语言障碍共享。通过...最新AI资源# AI副业赚钱项目# AI翻译# AI语音转文本2年前069.5K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术,能够自动识别和修复图像中的缺陷,同时支持用户进行交互式编辑。BrushEdit 结合了多种...最新AI资源# AI图像编辑# AI开源项目1年前069.5K
Eightify:用AI快速总结YouTube视频的高效学习助手Eightify 综合介绍 Eightify是一个利用YouTube AI技术,能够在几秒钟内为您提供视频的关键点和总结的工具。无论您是观看商业教育、播客、访谈、新闻还是讲座,Eightify都能帮助...最新AI资源# AI文本与音频/视频总结工具# 浏览器AI助手1年前069.5K
Pika:优秀的创意视频生成|文生视频|图生视频|图像视频融合Pika综合介绍 Pika.art是一个将想法转化成视频的平台,旨在提供给创意人士一个AI视频创作的工具。无论是想制作搞笑的短片、社交媒体内容还是短电影,Pika.art能跟随用户的想象力来创作。用户...最新AI资源# AI图像转视频# AI文本转视频11个月前069.5K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面,专为大语言模型(LLM)设计。它支持多种文本生成后端,包括 Transformers、llama.cp...最新AI资源# AI开源项目# AI本地化聊天应用1年前069.5K
知乎直达:智能问答与搜索工具,获取中文知识精准答案综合介绍 知乎直达(zhida.ai)是知乎推出的一款基于AI大模型的智能问答和搜索工具。它以知乎社区的优质内容为核心,结合多种数据源,为用户提供可靠的信息获取途径。知乎直达不仅能生成简略和深入两种答...最新AI资源# AI搜索工具2年前069.5K
Topaz Labs:AI智能图像和视频处理专家,照片视频修复与无损放大综合介绍 Topaz Labs提供了以AI为核心的图片和视频增强软件,旨在为专业内容创作者提供优化的本地工作站体验。提供功能强大的Sharpen、Noise Reduction、Enlargement...最新AI资源# AI图像放大与修复# AI音视频编辑1年前069.5K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型Fun-ASR是钉钉与通义实验室联合推出的语音识别大模型。模型经过海量音频数据训练,能精准识别多行业专业术语,如互联网、科技、家装等,显著提升识别准确率。模型结合钉钉企业信息进行推理优化,减少幻觉问题...最新AI资源8个月前069.4K
SongGeneration - 腾讯AI实验室推出的音乐生成模型SongGeneration 是腾讯 AI 实验室推出的高质量歌曲生成项目。基于 LeLM(Large Language Model for Music)框架,能并行生成人声与伴奏,实现二者和谐统一...最新AI资源10个月前069.4K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具综合介绍 Bilingual Book Maker 是一个开源项目,旨在利用AI技术帮助用户创建多语言版本的电子书。该工具主要使用ChatGPT进行翻译,支持多种文件格式,包括epub、txt和srt...最新AI资源# AI开源项目# AI翻译1年前069.4K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结综合介绍 Amurex是由The Personal AI Company开发的开源AI会议助手,旨在通过智能化的功能提升会议效率。Amurex能够实时提供建议、生成智能总结、记录会议内容,并自动发送跟...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前069.4K
OWL:多智能体协作完成现实任务的自动化工具综合介绍 OWL(Optimized Workforce Learning)是由 CAMEL-AI 团队开发的一个开源框架,专注于优化多智能体协作以实现真实世界任务的自动化。基于 CAMEL-AI 架...最新AI资源# AI开源项目# 智能体开发框架1年前069.4K
Zuni:读取网页内容提供帮助的侧边栏AI助手综合介绍 Zuni是一款Chrome浏览器侧边栏的AI助手,旨在通过实时分析网页和整合Gmail功能提升用户效率。它由Old House Labs, Inc.开发,2024年由George Seabr...最新AI资源# 浏览器AI助手1年前069.4K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容综合介绍 Voicenotes 是一款智能语音笔记应用,旨在帮助用户轻松记录和管理语音笔记及会议内容。该应用支持100多种语言的语音转录,用户只需说出想法,Voicenotes 即可自动将其转录为文字...最新AI资源# AI笔记# AI语音转文本1年前069.4K
They See Your Photos:基于 Google Vision 照片隐私信息分析综合介绍 They See Your Photos 是一个简单易用的在线工具,旨在帮助用户了解照片中隐藏的隐私信息。用户可以上传任意图片,网站通过人工智能技术分析图像内容和元数据,展示照片可能泄露的细...最新AI资源# AI图像生成辅助工具1年前069.3K
G-Search-MCP:免费谷歌搜索的MCP服务器综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具,托管在 GitHub 上,由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP(Model Context...最新AI资源# AI开源项目# MCP服务1年前069.3K
Shandu:多轮收集分析信息的AI研究自动化工具综合介绍 Shandu 是一个基于人工智能的开源研究系统,托管在GitHub上,由开发者jolovicdev创建。它利用 LangChain 和 LangGraph 技术,旨在为用户提供自动化、全面且...最新AI资源# AI开源项目# 生成深度研究报告1年前069.3K
Seed-X - 字节跳动推出的开源多语言翻译模型Seed-X 是字节跳动 Seed 团队推出的多语言翻译模型,具备 70 亿参数,支持 28 种语言的双向翻译。模型融合多语言数据预训练、指令微调和强化学习技术,能高效处理复杂语言模式,让翻译质量更出...最新AI资源9个月前069.2K
TripoSG:单张图像生成高分辨率3D建模数字资产综合介绍 TripoSG 是由 VAST AI 研究团队开发的一个开源项目,能从单张图像生成高质量的 3D 模型。项目使用大规模整流流变换器技术,结合混合监督训练和优质数据集,让生成的 3D 模型拥有...最新AI资源# AI开源项目# AI文本与图片转3D1年前069.2K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)综合介绍 RapBank 是一个专为说唱歌词生成而设计的数据集和工具集。该项目由 NZqian 创建,旨在通过收集和处理来自 YouTube 的说唱歌曲,为研究人员和开发者提供一个高质量的说唱歌词数据...最新AI资源# AI开源项目# AI音乐1年前069.2K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码,能够在单个NVIDIA RTX 3090 GPU上高效处理...最新AI资源# AI开源项目# 知识检索与RAG框架1年前069.2K
美图奇想大模型:图像与视频生成工具开放平台综合介绍 MiracleVision 是由美图公司开发的一款AI视觉大模型工具,致力于为用户提供多样化、高质量的图像和视频生成服务。该网站展示了其最新版本 MiracleVision 4.0 的强大功...最新AI资源# AI开放服务1年前069.2K
Deepseek Artifacts:使用最佳开源模型生成React代码,目标是构建公共前端代码开放数据集综合介绍 Deepseek Artifacts 是一个利用世界上最好的开源模型来创建React应用的网站。用户可以通过描述他们梦想中的React应用,网站将使用 Deepseek V3(原模型:Met...最新AI资源# AI开放服务# AI编程1年前069.2K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化综合介绍 Eko 是一个生产级的 JavaScript 框架,旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下,利用AI技术自动化日常任务。Eko提供了一个统...最新AI资源# AI开源项目# 低代码工作流# 智能体应用1年前069.1K
MemeCam:使用AI生成搞笑表情包,在图片中加入搞笑文字,生成有趣的表情包。综合介绍 MemeCam 是一个创新的AI驱动平台,专门用于生成搞笑的表情包。用户可以通过上传图片或使用摄像头拍摄照片,MemeCam 会利用先进的 GPT-4o 技术进行图像识别,并自动生成有趣的文...最新AI资源# AI图像编辑1年前069.1K
在 Cloudflare Workers 中快速部署 MCP 服务综合介绍 Cloudflare Workers MCP 是由 Cloudflare 开发的一个开源项目,托管于 GitHub,旨在帮助开发者快速构建并部署基于 Cloudflare Workers 的...最新AI资源# AI开源项目# MCP服务1年前069.1K
llms.txt:为大语言模型提供标准化网站信息文档综合介绍 llms.txt是一个专门为大语言模型(LLM)设计的标准化文档格式,旨在帮助网站提供简洁、结构化的信息,便于LLM在推理过程中高效利用。这个规范得到了Cloudflare和Anthropi...最新AI资源# AI开放服务1年前069.1K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品综合介绍 Whisk是Google Labs推出的一款创新型AI图像生成工具,旨在通过上传多张图片来混合不同的主题、场景和风格。与传统的依赖文本提示的图像生成工具不同,Whisk主要使用图像作为输入...最新AI资源# AI图像风格控制11个月前069.1K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索...最新AI资源# AI开源项目# 文档提取与清洗1年前069.1K
RolmOCR:识别手写和倾斜字符的文档OCR模型综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别(OCR)工具,基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字,速度比同类工具...最新AI资源# AI开源项目# OCR1年前069K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI资源# AI开源项目# AI翻译# AI语音转文本1年前069K
removebg:一键去除图片背景,removebg在线免费中文版removebg 综合介绍 removebg是一款在线自动去除图片背景的工具,用户仅需上传图片,系统即刻为你提供无背景的透明图像。 removebg利用了先进的人工智能技术,可以识别图片中的人物、动物...最新AI资源# AI抠图改背景2年前069K
Mootion:完整的视觉故事创作平台综合介绍 Mootion 是一个 AI 原生内容创作平台,旨在帮助用户将创意转化为视觉故事。该平台涵盖了3D动画、视频制作和游戏开发等多个创作流程,并与 Blender、Maya 和 Unity 等主...最新AI资源# AI文本转视频2年前069K
Jules:实验性AI代码助手,可自动执行Python和JavaScript编码任务,例如GitHub工作流中的错误修复。综合介绍 Jules是Google Labs推出的一款AI代码助手,旨在帮助开发者提升编程效率。它集成了最新的Gemini 2.0 Flash模型,能够在Github上为开发者提供智能代码建议和自动化...最新AI资源# AI编程1年前068.9K
Whispers from the Star:米哈游开发的AI实时互动科幻故事游戏综合介绍 “Whispers from the Star”(群星低语)是Anuttacon公司开发的一款实时互动科幻故事游戏。这款游戏由米哈游创始人蔡浩宇创立的Anuttacon推出,设定在深空,玩家...最新AI资源# AI角色扮演1年前068.9K
xyks:小猿口算逆向笔记,逆向工程与解密算法综合介绍 小猿口算逆向笔记是一个开源项目,旨在记录和分享对小猿口算应用进行逆向工程的过程和方法。该项目包含了多种逆向工具和技术的使用说明,如Frida、dexdump等,帮助用户了解和破解小猿口算的加...最新AI资源# AI开源项目# AI教育工具2年前068.9K
Animation:实时生成3D动画,打造栩栩如生的虚拟角色综合介绍 Animation Inc是一家专注于实时生成动画技术的科技公司。公司致力于通过先进的AI技术和动画引擎,打造栩栩如生的虚拟角色,提升大语言模型(LLM)驱动的互动体验。公司由前Meta工程...最新AI资源# AI文本与图片转3D1年前068.9K
Portkey:连接多种AI模型并管理应用的开发工具综合介绍 Portkey 是一个帮助企业和开发者快速构建、管理和优化AI应用的平台。它通过统一的AI网关连接超过200种大语言模型(LLM),提供提示管理、负载均衡和实时监控等功能。网站的核心目标是让...最新AI资源# AI开放服务1年前068.9K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型综合介绍 Raycast-G4F(GPT4Free) 是一款强大的 Raycast 扩展工具,让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...最新AI资源# AI开源项目# AI本地化聊天应用# 免费大模型API1年前068.9K
R1 Overthinker:强制 DeepSeek R1 模型延长思考时间综合介绍 DeepSeek R1 Overthinker 是一个专为增强 DeepSeek R1 模型思考深度而设计的工具。通过延长模型的推理过程,该工具能够使模型进行更深入的思考,从而提高其回答的质...最新AI资源# AI开源项目1年前068.8K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格综合介绍 YuE是一个开源的全歌曲生成基础模型,专注于将歌词转化为完整的歌曲。与其他仅能生成短片段非声乐音乐的模型不同,YuE能够生成包含主唱和伴奏的完整歌曲,时长可达数分钟。该模型解决了音乐生成中的...最新AI资源# AI开源项目# AI音乐1年前068.8K
OpenAI Translator:多平台翻译增强工具|全局划词翻译综合介绍 openai-translator是一款基于OpenAI的ChatGPT API开发的翻译增强工具。它包括浏览器插件和跨平台的桌面应用程序。支持翻译、润色和总结三种模式,涵盖了55种不同...最新AI资源# AI翻译2年前068.8K
Paper2Code:将机器学习论文自动转化为可运行代码综合介绍 Paper2Code 是一个开源项目,旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型(LLM)系统 PaperCoder,将科学论文自动转化为可运行的代码仓库。系统采用规划...最新AI资源# AI开源项目# 智能体应用12个月前068.8K
Weebo:实时语音聊天机器人,提供自然语言对话体验综合介绍 Weebo 是一个开源的实时语音聊天机器人,利用 Whisper Small 进行语音识别,Llama 3.2 进行自然语言生成,以及 Kokoro-82M 进行语音合成。该项目由 Aman...最新AI资源# AI开源项目# 多模态实时互动产品1年前068.8K
OhMyGPT:免费使用GPT-3.5-16k和各类大模型转发APIOhMyGPT 可以让你便捷地无限量访问GPT-3.5-turbo、GPT-3.5-turbo-16k、GPT-4、GPT-4-32k、DALL-E、whisper、MidJourney等先进的AI模...最新AI资源# AI开放服务# AI集成多模型对话平台2年前068.8K
Artflow:创作人物一致性的动画故事和虚拟数字人口播视频综合介绍 Artflow是一个线上平台,使用户能够上传照片,训练专属的AI角色,创作角色一致性的视频和动画故事。提供首次免费培训,用户可以自定义身份,创造独一无二的图像及视频,满足各种场景需求。 每月...最新AI资源# AI换脸与换装# AI数字人# AI文本转视频2年前068.8K
SegAnyMo:从视频中自动分割任意运动物体的开源工具综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新AI资源# AI开源项目# AI抠图改背景# 视觉目标检测1年前068.7K
收集免费对话大模型逆向转API接口免费登录 GPT3.5 转 API https://github.com/missuo/FreeGPT35 https://github.com/aurora-develop/aurora https...最新AI资源# 免费大模型API1年前068.7K
ToolJet:使用文字描述快速构建和部署企业内部应用程序综合介绍 ToolJet 是一个由 AI 驱动的企业应用开发平台,通过简单的自然语言描述即可创建自定义 AI 应用和代理。用户只需描述所需的应用,ToolJet 即可完成 UI、数据库和查询等所有设置...最新AI资源# 无代码开发1年前068.7K
Viggle:可控人物动作视频生成|视频人物转换风格综合介绍 Viggle是一个基于JST-1模型驱动的视频生成服务平台,专注于角色视频生成。用户能通过文本提示来控制任何角色的动作,将静止的角色与动作视频混合,或完全用文本创造出视频。目前,Viggle...最新AI资源# AI图像转视频# AI视频转换风格# 口型同步1年前068.7K
文心智能体平台:建立在完整分发渠道和商业闭环的智能体应用介绍 文心智能体平台AgentBuilder 是百度推出的基于文心大模型的智能体(Agent)平台,支持广大开发者根据自身行业领域、应用场景,选取不同类型的开发方式,打造大模型时代的产品能力。开发者可...最新AI资源# 智能体应用1年前068.6K
Unscreen:自动移除视频背景,轻松制作无背景视频综合介绍 Unscreen 是一个强大的在线工具,专注于自动移除视频背景。用户只需上传视频或提供视频链接,Unscreen 即可自动分析并移除背景,无需复杂的操作。该工具支持多种视频格式,包括 .mp...最新AI资源# AI抠图改背景1年前068.6K