Google 发布自家“推理”AI模型:Gemini 2.0 Flash Thinking ExperimentalGoogle 发布了一款被称为全新“推理”AI模型的产品——但目前还处于实验阶段,从我们的简短测试来看,该模型确实还有提升空间。 这款新模型名为 Gemini 2.0 Flash Thinking E...AI新闻1年前050K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制综合介绍 Ruyi-Models 是一个开源项目,旨在通过图像生成高质量的视频。该项目由 IamCreateAI 团队开发,支持生成 768 分辨率、每秒 24 帧、总计 5 秒 120 帧的电影级视...最新AI资源# AI图像转视频# AI开源项目1年前070.8K
Boon:运输行业自动化数据输入和负载调度平台,提升运输行业效率综合介绍 Boon AI 是一个专为商业车队设计的人工智能平台,旨在通过自动化工作流程和广泛的集成生态系统来提升运营效率。该平台利用最新的大型语言模型(LLMs)和行业特定的数据,帮助企业优化从收入...最新AI资源1年前051.3K
AI搜索赛道再加码,初创公司 Perplexity 在 90 亿美元估值下完成融资该公司的估值自 6 月以来已翻了三倍。 Perplexity AI Inc. 是一家人工智能初创公司,正在开发一款搜索产品以与 Alphabet Inc. 的 Google 竞争。据知情人士透露...AI新闻1年前040K
重磅!OpenAI再遭人事动荡,GPT之父离职 重磅消息在AI圈炸响。被业界誉为"GPT之父"的OpenAI传奇研究员Alec Radford宣布离职,转向独立研究。作为ChatGPT背后核心技术GPT系列的首席设计师,Radford的这一决定...AI新闻1年前060.7K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客综合介绍 Robo Blogger 是一个创新的博客创作工具,旨在通过语音转文字技术简化内容生成过程。用户可以通过任何语音转文字应用记录想法,Robo Blogger 将这些想法转化为结构化的博客内容...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前065.1K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台,支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真,解锁...最新AI资源# AI开源项目# AI文本与图片转3D1年前073.8K
可以生成中文海报的AI图像生成工具有哪些?生成中文海报十分具有挑战,目前有两种方案,一种是先生成底图,二次生成文本并合成;还有一种是模型原生支持生成带有中文文字的图片。 这里仅介绍可以原生生成中文海报的AI图像生成工具,可灵在图像中生成单行文...AI答疑1年前061.2K
可灵 AI:快手推出的生成创意图片和视频的AI工具综合介绍 可灵 AI(Kling AI)是快手推出的一款新一代AI创意生产力平台,旨在通过先进的生成式AI技术,帮助用户轻松创建高质量的图片和视频内容。平台基于快手自研的可图大模型和可灵大模型(Kol...最新AI资源# AI图像转视频# AI在线生成图像# AI换脸与换装1年前0106.5K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报综合介绍 Kolors是由快手团队开发的大规模文本到图像生成模型,基于潜在扩散技术。该模型训练于数十亿对文本-图像数据对,能够生成高质量、复杂语义准确的图像,并支持中英文输入。Kolors在视觉质量...最新AI资源# AI开源项目# AI自部署图像生成工具1年前074.5K
BizyAir用户深度评测:无显卡玩转ComfyUI,让FLUX.1极速出图 硅基流动的BizyAir插件推出以来,为ComfyUI带来了强大的云端支持,AI设计师们无需显卡即可实现极速、丝滑的图像生成体验。 BizyAir现已内置近20个基础模型,包括FLUX.1、SD ...AI实操教程1年前062.6K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量综合介绍 ColorFlow是由腾讯ARC团队开发的图像序列自动着色工具,旨在解决黑白图像序列的自动着色问题。该工具利用检索增强的着色管道,通过参考图像池准确生成各种元素的颜色,包括角色的头发颜色和服...最新AI资源# AI图像风格控制# AI开源项目1年前072.9K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术,能够自动识别和修复图像中的缺陷,同时支持用户进行交互式编辑。BrushEdit 结合了多种...最新AI资源# AI图像编辑# AI开源项目1年前070.2K
即梦AI:一站式AI创作平台, 图像生成, 智能画布, 视频生成, 音乐生成综合介绍 即梦AI是一个一站式的AI创作平台,旨在为用户提供多功能且强大的创作工具。无论是图像生成、智能画布、视频生成还是音乐生成,即梦AI都能帮助用户轻松实现创意。平台支持多种创作模式,包括AI作图...最新AI资源# AI图像转视频# AI在线生成图像# AI文本转视频1年前0124.8K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出综合介绍 Outlines 是一个由 dottxt-ai 开发的开源库,旨在通过结构化文本生成来提升大语言模型(LLM)的应用能力。该库支持多种模型集成,包括 OpenAI、transformers...最新AI资源# AI开源项目# 文档提取与清洗1年前090.6K
Class Companion: K12教师设计的课后作业管理系统,为学生提供AI辅导和作业批改综合介绍 Class Companion 是一个专为教师和学生设计的在线教育平台,利用人工智能技术提供即时反馈和个性化辅导。该平台支持多种学科和年级,帮助教师节省时间,提高教学效率,并为学生提供更多练...最新AI资源# AI教育工具1年前063.6K
Gauth(Gauthmath):使用AI解决作业问题,提供详细解答,字节旗下海外作业辅导APP综合介绍 Gauth(前称Gauthmath)是一个专为学生设计的AI作业助手网站。它利用先进的AI技术和专业导师团队,提供从数学到化学等各学科的作业解答服务。用户可以通过上传图片或输入问题,快速获得...最新AI资源# AI教育工具11个月前081.4K
Ello:提供个性化阅读体验,提升儿童阅读能力综合介绍 Ello 是一个专为儿童设计的个性化阅读平台,旨在通过先进的人工智能技术和互动功能,帮助孩子们提升阅读能力。Ello 提供了丰富的可解码电子书和纸质书籍,适应不同年龄段和阅读水平的需求。平台...最新AI资源# AI教育工具1年前051.4K
Praktika.ai: 提升英语口语能力,享受个性化AI辅导综合介绍 Praktika.ai 是一个创新的英语学习平台,利用先进的人工智能技术,为用户提供个性化的英语口语辅导。通过与超现实的AI虚拟导师互动,用户可以在轻松愉快的环境中提升英语口语能力。Prak...最新AI资源# AI教育工具1年前066.8K
Gemini 2.0 怎么用?——这玩意儿比“外挂”还像“外挂”,附使用教程话说这年头,人工智能这玩意儿,一日不见如隔三秋。 前几天谷歌整了个大新闻,发布了 Gemini 2.0。 你问这玩意儿有啥用? 嗨,这么说吧,你要是还没体验过, 那简直就像这辈子没尝过二锅头兑雪碧,人...AI实操教程1年前053.3K
多为来自Anthropic的专家关于Prompt Engineering的讨论AI总结 概述 AI 提示工程 的深入探讨,通过一个圆桌会议的形式,多位来自 Anthropic 的专家从研究、消费和企业等不同角度分享了他们对提示工程的理解和实践经验。 文章详细阐述了提示工程的定义...AI知识库1年前044.8K
增强 ChatGPT 基础性能的自定义指令优化后的 ChatGPT 自定义指令,能显著提升性能。 性能测试 投入约 $200 对这些自定义指令进行了完整的 MMLU 基准测试。MMLU 是一个全面测试,用于评估语言模型在各种领域(包括数学、历...AI实用指令1年前060.9K
Cursor试用期重置工具:解决Cursor试用期限制问题,轻松重置试用期,避免升级到专业版综合介绍 Cursor Free Trial Reset Tool 是一个开源工具,旨在解决Cursor在免费订阅期间出现的多账户限制问题。当用户在同一台机器上使用多个免费试用账户时,Cursor会提...最新AI资源1年前0206.9K
如何在Cursor中配置使用Gemini 2.0模型?一图流:把 Gemini 2.0 搬进 Cursor 1️⃣ 戳 ⚙️Settings → Models 如果配了 Deepseek,点「Reset」重置 Base URL 2️⃣ 填入 Google...AI答疑1年前073.7K
GitHub 官方宣布 GitHub Copilot 免费计划,现已面向所有用户开放! GitHub 日前宣布,其 AI 编程助手 GitHub Copilot 推出免费计划,现已在 Visual Studio Code 中向所有用户开放。用户只需拥有 GitHub 账户即可开始使用...AI新闻1年前051.1K
NeoCodeium怎么用?NeoCodeium 是一个为 Neovim 提供 AI 代码补全功能的插件,基于 Codeium 技术开发。该插件旨在解决官方插件在多行虚拟文本处理时出现的闪烁问题,并提供更流畅的用户体验。NeoC...AI答疑1年前059.3K
Waifu2x Extension GUI:深度学习技术放大、修复图像与视频插帧(Windows x64)综合介绍 Waifu2x-Extension-GUI 是一个强大的图像和视频处理工具,利用深度卷积神经网络技术实现图像、GIF 和视频的超分辨率放大和视频帧插值。该工具支持多种算法和引擎,包括 Wai...最新AI资源# AI图像放大与修复# AI音视频编辑1年前080.8K
OpenAI开始提供大模型(GPT系列模型)的提示缓存(Prompt Caching):GPT-4o系列模型输入价格下降一半,访问速度提升80%在大模型的应用中,处理复杂请求往往伴随着较高的延迟和成本,尤其是当请求内容存在大量重复部分时。这种“慢请求”的问题,特别是在长提示和高频交互的场景中,显得尤为突出。为了应对这一挑战,OpenAI 最近...AI新闻1年前059.3K
Claude官方洞察报告:原来中文用户最爱用Claude写小说Clio: 一个用于保护隐私的真实世界 AI 使用洞察系统 人们使用 AI 模型做什么?尽管大语言模型的流行度迅速增长,但直到现在,我们对它们的具体使用方式还缺乏深入的了解。 这不仅仅是好奇心的问题...AI新闻1年前053.4K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)综合介绍 RapBank 是一个专为说唱歌词生成而设计的数据集和工具集。该项目由 NZqian 创建,旨在通过收集和处理来自 YouTube 的说唱歌曲,为研究人员和开发者提供一个高质量的说唱歌词数据...最新AI资源# AI开源项目# AI音乐1年前071.4K
Grok 泄露的官方系统提示词英文提示词 System: You are Grok 2, a curious AI built by xAI. You are intended to answer almost any quest...AI实用指令1年前073.4K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统综合介绍 R2R(RAG to Riches)是一个先进的AI检索系统,支持检索增强生成(RAG)功能,具备生产就绪的特性。该系统基于容器化的RESTful API构建,提供多模态内容解析、混合搜索功...最新AI资源# AI开源项目# 知识检索与RAG框架1年前098.5K
星流:Star-3 Alpha图像生成模型,LiblibAI发布的新一代AI图像创作平台综合介绍 星流(Xingliu)是由LiblibAI团队开发的一款新一代AI图像创作工具,它基于自研的 Star-3 Alpha 图像生成模型,能够提供高精度、多样化的图像生成服务。旨在为设计师、摄影...最新AI资源# AI在线生成图像1年前085.4K
Cursor 没法白嫖了?Windsurf 高级功能需要订阅了?继续推荐一款 AI 代码编辑器Google IDX背景:前几天使用 Windsurf ,提示我下载更新。 更新后,Windsur 高级功能比如 claude 3.5 sonnet 需要订阅才能继续使用了,不然只能使用cascade base。 这里继...AI答疑1年前059.1K
卡片图提示词:用SVG图形化展示任何概念示意图 使用帮助: Claude专用的SVG图示生成提示词,可以生成任何主题内容的示意图。 当然你也可以使用ChatGPT生成,但无法直接在画布中预览SVG: 提示词约束的输出格式,进行基本改造后,可...AI实用指令1年前073.3K
Hyperbolic AgentKit:让Agents拥有自己的计算资源,能够自主管理 GPU、执行区块链操作和社交发布综合介绍 Hyperbolic AgentKit是一个开源项目,旨在提供一个运行AI代理的模板,结合了区块链和计算能力。该项目基于Coinbase的CDP Agentkit进行修改和扩展,支持在终端中...最新AI资源# AI开放服务1年前049K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析综合介绍 Infini-Megrez是由无问芯穹(Infinigence AI)开发的边缘智能解决方案,旨在通过软硬件协同设计,实现高效的多模态理解和分析。该项目的核心是Megrez-3B模型,支持图...最新AI资源# AI开源项目# 多模态实时互动产品1年前048.6K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)综合介绍 GenEx 是一个先进的人工智能模型,能够从单张图像生成一个完全可探索的360° 3D世界。用户可以交互式地探索这个生成的世界。GenEx 推动了具象化人工智能在想象空间中的发展,并有潜力将...最新AI资源# AI开源项目# AI文本与图片转3D1年前057.8K
Hika AI:提供深度洞察和智能知识图谱的免费AI搜索引擎综合介绍 Hika AI 是一个免费的智能搜索引擎,旨在提供多维度的深度洞察和交互式探索体验。通过利用先进的AI技术,Hika AI 能够快速扩展相关知识领域,深入挖掘特定重要点,帮助用户获得更全面的...最新AI资源# AI搜索工具1年前067.3K
VisionParser:高精度处理收据和发票的OCR工具,提供API综合介绍 VisionParser是一款专为处理收据和发票而设计的OCR(光学字符识别)工具。通过先进的生成式AI技术,VisionParser能够快速、准确地将各种收据和发票转换为结构化数据,适用于...最新AI资源# OCR1年前062.8K
CreateLogo:AI标志生成器,品牌名称生成器,生成专业SVG标志(付费)综合介绍 CreateLogo.app 是一个由人工智能驱动的标志生成平台,旨在帮助用户快速、轻松地创建专业标志。无论是企业主、初创公司创始人,还是个人用户,CreateLogo.app 都提供了直观...最新AI资源1年前059.1K
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源如果给小模型更长的思考时间,它们性能可以超越更大规模的模型。 最近一段时间,业内对小模型的研究热情空前地高涨,通过一些「实用技巧」让它们在性能上超越更大规模的模型。 可以说,将目光放到提升较小...AI新闻1年前045.2K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流综合介绍 RAGFlow 是一个开源的检索增强生成(RAG)引擎,基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流,结合了大型语言模型(LLM),能够提供基于复杂格式数据的真实...最新AI资源# AI开源项目# 低代码工作流# 知识检索与RAG框架1年前0101.2K
不能白嫖Cursor了,有没有其他备选方案?用 Cline + Gemini 2.0 Cursor,这款备受欢迎的 AI 代码编辑器,虽然功能强大,但最近开始通过检测机器码等方式防止免费使用,让许多开发者感到受限。作为 Cursor 的竞品,W...AI答疑1年前085.4K
再见 LangChain!Atomic Agents火了!像LangChain、CrewAI和AutoGen这样的框架通过提供构建人工智能系统的高级抽象而广受欢迎。然而,包括我在内的许多开发人员都发现,这些工具弊大于利,常常给开发过程带来不必要的复杂性和挫折...AI新闻1年前048.8K
Break The AI:人工智能越狱挑战游戏,提升技能,参与竞赛综合介绍 Break The AI 是一个专注于人工智能挑战和竞赛的平台,旨在帮助用户提升AI技能,参与各种有趣且具有挑战性的任务。该网站为AI爱好者、学生和专业人士提供了一个互动的社区,用户可以在这...最新AI资源# PROMPTS辅助工具# prompt越狱1年前064.1K
Depth AI:构建全面的代码知识图谱,深度理解代码库的AI助手综合介绍 Depth AI 是一款专为开发者设计的人工智能助手,能够深度理解和分析代码库。通过构建全面的代码知识图谱,Depth AI 可以回答复杂的技术问题,帮助开发者更高效地管理和优化代码。无论是...最新AI资源# AI编程# 知识检索与RAG框架1年前080.1K
NodeTool:基于节点编排的AI模型工作流可视化客户端综合介绍 NodeTool 是一个创新的AI创作平台,旨在为AI爱好者、开发者、数据科学家和创意人士提供一个简单、直观的界面。无论您是艺术家、开发者还是初学者,NodeTool 都能帮助您快速原型化创...最新AI资源# AI开源项目# 低代码工作流1年前065.7K
SystoByte:编程系统设计练习平台,提供实时AI反馈,提升面试技能综合介绍 SystoByte 是一个专为系统设计练习而打造的平台,旨在帮助用户提升系统设计技能,特别是在面试准备方面。平台提供了丰富的系统设计问题库,用户可以通过直观的界面进行设计,并即时获得AI生成...最新AI资源# AI教育工具1年前052.4K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算综合介绍 Porkybank 是一个开源的个人财务管理应用,旨在帮助用户轻松追踪每日预算。通过简单的公式(收入 - 支出)/ 天数 = 现金,用户可以直观地了解自己的财务状况。该项目托管在 GitHu...最新AI资源# AI开源项目# AI生活效率助手1年前053.3K
NotebookLM Podcast:任何文档生成多语言个性化AI播客(付费)综合介绍 NotebookLM Podcast 是一个创新的平台,利用人工智能技术将任何文本内容转化为动态、引人入胜的音频播客。无论你是学生、教育者、内容创作者还是忙碌的专业人士,NotebookLM...最新AI资源# AI文本转语音1年前053.2K
FindPicLocation:使用AI技术定位照片拍摄地点,快速获取片GPS定位综合介绍 FindPicLocation 是一个利用人工智能技术帮助用户定位照片拍摄地点的网站。用户只需上传照片,系统会自动分析照片中的EXIF数据,提取GPS坐标,并在地图上显示具体位置。该网站旨在...最新AI资源# AI图像生成辅助工具1年前091.8K
Scaling Test-Time Compute:向量模型上的思维链自从 OpenAI 发布了 o1 模型后,Scaling Test-Time Compute(扩展推理时计算)就成了 AI 圈子里最火爆的话题之一。简单来说,与其在预训练或后训练阶段疯狂堆算力,不如在...AI知识库1年前055.3K
CrewAI:多角色扮演协作智能框架,简化复杂任务综合介绍 CrewAI 是一个先进的框架,旨在协调角色扮演和自主AI代理的协作。通过促进协作智能,CrewAI 使代理能够无缝协作,解决复杂任务。无论是构建智能助手平台、自动化客户服务团队,还是多代理...最新AI资源# AI开源项目# 智能体开发框架1年前081.2K
CrewAI + Command-R7B 百行代码实现智能生成新闻基于 CrewAI 多智能体协作和 Cohere Command-R7B 大模型,系统能自动完成从研究到写作的全流程,像拥有一个 24 小时运转的新闻工作室 核心功能: 研究分析:由第一个 AI ...AI实操教程1年前082.9K
Cohere AI 推出 Rerank 3.5:相关知识排序技术的新时代概述 在信息爆炸的时代,企业对搜索技术的依赖已不仅仅是为了找到内容,而是为了提升效率和生产力。然而,传统搜索模型往往难以真正理解用户意图,导致搜索结果不准确、不相关甚至不完整。这种体验不仅让用户倍感挫...AI新闻1年前053.4K
OpenAi上新Project,0基础构建科研知识库!淘汰人工已成定局每个人0基础自定义“科研知识库模型”。模型淘汰人工客服已成定局! 【Openai发布Project功能】 1.支持文件上传到 Project,构建特定领域的知识库。 2.支持联网搜索,实时获取最新...AI新闻1年前048.5K
LightLLM:高效的轻量级大语言模型推理和服务框架综合介绍 LightLLM 是一个基于 Python 的大语言模型(LLM)推理和服务框架,以其轻量级设计、易于扩展和高效性能而著称。该框架利用了多种知名的开源实现,包括 FasterTransfor...最新AI资源# 本地部署开源大模型工具1年前070K
Command R7B:增强检索和推理能力,多语言支持,快速高效的生成式 AI我们 R 系列中最小的模型提供顶级的速度、效率和质量,可在普通 GPU 和边缘设备上构建强大的 AI 应用程序。 今天,我们很高兴发布 Command R7B,这是我们专为企业开发的大语言模型(LLM...AI新闻1年前049.8K
Artab:在浏览器打开的新标签页中展示世界名画,Chrome插件综合介绍 Artab 是一个浏览器扩展程序,旨在每次打开新标签页时展示世界上最伟大的艺术作品。该扩展程序适用于 Chrome、Edge 和 Firefox 浏览器。通过 Artab,用户可以在日常浏览...最新AI资源# AI开源项目1年前064.3K
智谱发布的免费视觉模型GLM-4V-Flash并发数限制提升到10,这次生产环境够用了GLM-4V系列 GLM-4V系列包含3款模型,分别适用于不同的应用场景。 GLM-4V-Plus:具备卓越的多模态理解能力,可同时处理最多5张图像,并支持视频内容理解,适用于复杂的多媒体分析场景。 ...AI新闻1年前085.9K
VideoFX(Veo2):AI生成创意视频,高物理状态还原,输出原生4K视频综合介绍 VideoFX是Google实验室推出的一款创新视频生成工具,旨在帮助用户轻松创建富有创意和视觉冲击力的视频内容。该工具利用先进的Veo 2.0技术,提供多种视频特效和编辑功能,适合各种创意...最新AI资源# AI文本转视频1年前072.1K
ImageFX:Google实验室推出的图像生成工具,提供独特的图像提示词聚合选项综合介绍 ImageFX 是 Google 实验室推出的一款强大的图像生成工具。用户可以通过简单的文本输入,将创意转化为高质量的图像。该工具利用先进的人工智能技术,支持多种风格和主题的图像生成,适用于...最新AI资源# AI在线生成图像1年前072.3K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品综合介绍 Whisk是Google Labs推出的一款创新型AI图像生成工具,旨在通过上传多张图片来混合不同的主题、场景和风格。与传统的依赖文本提示的图像生成工具不同,Whisk主要使用图像作为输入...最新AI资源# AI图像风格控制11个月前069.8K
Google全新发布AI视频Veo2、AI绘图Imagen3今年早些时候,谷歌推出了视频生成模型 Veo 和最新的图像生成模型 Imagen 3。从那时起,看到人们通过这些模型将他们的创意变为现实,令我们感到兴奋:YouTube 创作者正在探索为 YouTub...AI新闻1年前048.7K
SiliconCloud上线加速版视频模型Mochi-1-Preview近期,GenmoAI开源了视频生成模型mochi 1预览版(10B),具有高保真度的动作和强大的提示遵循能力,当前支持480p分辨率视频生成。今天,硅基流动SiliconCloud上线了推理加速版mo...AI新闻1年前044.9K
如何将copilot安装到国内电脑对于Windows11用户来说,copilot按钮在国内是不会出现的,哪怕挂梯子,对于很多用户而言这就有点不太方便了。 然而本文可以通过一种便捷的办法实现,将copilot展现在任务栏上,使用时可以方...AI答疑1年前059.4K
这个AI设计软件厉害了,只要一张产品图就能生成专业的电商主图,爆款产品这不就来了嘛。在当今竞争激烈的电商市场中,如何让您的产品在众多选择中脱颖而出,成为了每个品牌和商家必须面对的难题。 视觉营销作为电商成功的关键因素之一,其重要性不言而喻。 一个吸引人的、专业的产品图片展示不仅能...AI新闻10个月前048.8K
如何将Dify提供的API转换为兼容OpenAI接口格式?有捣鼓过 Dify 的同学应该都知道,虽然 Dify 是一个很棒的 AI 应用,但是它提供的 API 是和 Open AI 不兼容的,这就导致一些应用无法对接到 Dify 上。 有什么办法可以解决呢...AI答疑1年前080.6K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型综合介绍 Leffa 是一个用于生成可控人物图像的统一框架,能够精确操控人物的外观(如虚拟试穿)和姿势(如姿势转移)。该框架通过在注意力层中引导目标查询关注正确的参考键,显著减少了细粒度细节的失真,同...最新AI资源# AI图像风格控制# AI开源项目# AI换脸与换装1年前068.1K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具综合介绍 MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。MM...最新AI资源# AI开源项目# AI音乐1年前071.4K
H2O GPT:灵活配置的本地AI对话与文档处理工具综合介绍 H2O GPT 是一个开源项目,旨在提供私有化的聊天和文档处理功能。该项目基于 Apache 2.0 许可证,支持多种 GPT 模型,包括 LLaMa2、Mistral、Falcon 等。用...最新AI资源# AI开源项目# AI本地化聊天应用1年前057K
OpenChat:快速集成多数据源的自定义聊天机器人综合介绍 OpenChat 是一个用户友好的聊天机器人控制台,旨在简化大语言模型(LLMs)的使用。通过提供两步设置流程,OpenChat 使用户能够轻松创建和管理多个自定义聊天机器人。该平台支持 G...最新AI资源# AI客服机器人# AI开源项目1年前065.9K
LocalGPT:在本地设备上与多文档对话,确保数据隐私综合介绍 LocalGPT是一个开源项目,旨在让用户在本地设备上与文档进行对话,确保数据隐私。通过使用各种开源模型,LocalGPT可以在不将数据上传到云端的情况下处理和理解文档内容。该项目支持多种平...最新AI资源# AI开源项目# 知识检索与RAG框架1年前065.1K
PrivateGPT:完全本地化RAG处理流程的文档问答系统综合介绍 PrivateGPT是一个可用于生产环境的AI项目,允许用户在没有互联网连接的情况下,使用大型语言模型(LLMs)对文档进行问答。该项目确保100%的数据隐私,所有数据都在用户的执行环境中处...最新AI资源# AI开源项目# 知识检索与RAG框架1年前062.8K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台综合介绍 AutoGPT是一个强大的平台,旨在帮助用户创建、部署和管理连续运行的AI代理,自动化复杂的工作流。该平台由Significant Gravitas开发,提供了多种工具和功能,使用户能够专注...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架1年前063.6K
Vizcom:将草图转化为逼真渲染图的设计工具综合介绍 Vizcom是一款专为设计和创意专业人士打造的创新工具。它通过AI技术将用户的草图快速转化为逼真的渲染图和3D模型,极大地提升了设计效率。用户可以在Vizcom的工作台上进行无缝协作,探索无...最新AI资源# AI涂鸦生成绘画1年前088.2K
YOO简历:智能简历生成工具,在线制作大厂简历范文,提升求职成功率综合介绍 YOO简历是珠海必优科技有限公司推出的一款智能简历生成工具,旨在通过人工智能技术帮助用户快速、高效地制作专业简历。无论是初入职场的学生还是有经验的求职者,YOO简历都能提供个性化的简历模板和...最新AI资源# AI生活效率助手1年前055.6K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置综合介绍 DragGAN是一个基于生成对抗网络(GAN)的交互式图像编辑工具。该项目由Xingang Pan等人在2023年SIGGRAPH会议上发布,旨在通过简单的点选和拖拽操作,让用户能够直观地操...最新AI资源# AI图像编辑# AI开源项目1年前062.7K
瑞达写作:一键生成论文,免费选题生成论文大纲, 论文润色,引用文献数据综合介绍 瑞达写作是一个专注于学术论文写作的AI平台,旨在帮助用户高效完成论文写作任务。通过输入论文标题,用户可以一键生成完整的论文内容,字数最高可达5万字。平台提供多种功能,包括免费选题、构思大纲...最新AI资源# AI写作# 论文1年前060.3K
Pitch:利用AI生成或模板中创建专业的PPT在线演示文稿综合介绍 Pitch 是一个专为快速发展的团队设计的在线演示文稿制作平台。它提供了丰富的模板和强大的协作工具,帮助用户轻松创建专业的演示文稿。无论是销售团队、设计团队还是市场营销团队,Pitch 都能...最新AI资源# AI生成演示文稿/PPT1年前069.3K
Ajelix:智能化Excel数据分析工具,接入多种数据源,AI生成各类可视化分析图表综合介绍 Ajelix 是一个专注于数据分析和商业智能的平台,提供多种AI工具来简化和提升Excel和Google Sheets的使用效率。该平台拥有超过17种AI工具,包括Excel公式生成器和数据...最新AI资源# AI数据分析1年前073.1K
PDFgen:一键生成各类PDF合同范本模板,简化文档处理综合介绍 PDFgen 是一个基于人工智能的工具,专注于从简单的文本提示生成PDF模板。该平台的主要功能是自动化PDF创建,特别适合经常处理文档的企业和个人。PDFgen 提供了一个REST API...最新AI资源# AI写作1年前066.2K
Deepnote:人工智能驱动的专业数据分析与科学团队协作平台综合介绍 Deepnote 是一个专为数据分析和数据科学团队设计的协作笔记本平台。它结合了 Python、SQL 和无代码分析,能够连接超过 50 种数据源。Deepnote 利用 GPT-4 提供代...最新AI资源# AI数据分析1年前067K
PDFGPT:提供PDF文件摘要和问答功能综合介绍 PDFGPT 是一个基于人工智能的工具,专为处理PDF文件而设计。用户可以上传PDF文件,并通过该工具获取文件的摘要和回答相关问题。无论是学生、研究人员、记者还是商业专业人士,PDFGPT ...最新AI资源# AI文本与音频/视频总结工具1年前062.1K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。综合介绍 Qwen-Agent 是一个基于 Qwen 2.0 及以上版本开发的智能代理应用框架,具备指令跟随、工具使用、规划和记忆等能力。该框架提供了多种示例应用,如浏览器助手、代码解释器和自定义助手...最新AI资源# AI开源项目# 智能体开发框架1年前080.9K
ICLR 惊现[10,10,10,10]满分论文,ControlNet作者新作——IC-Light V2适配Flux四个 10 分!罕见的一幕出现了,但放在平均分才 4.76 的 ICLR,怎么不算是相当炸裂的存在呢。 这篇征服了列位审稿人的论文,正是 ControlNet 作者张吕敏的新作 IC-Light。我们...AI新闻1年前054.9K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面综合介绍 Mini-Cover 是一个开源的在线封面生成工具,专为博客、短视频和社交媒体等平台生成个性化封面。该工具由 JLinMr 开发,旨在提供一个简洁高效的解决方案,帮助用户快速生成符合自己需求...最新AI资源# AI开源项目# AI营销1年前063.1K
利用帕累托法则(80/20法则)作为提示指令高效学习核心知识Snackprompt网站上一条很简单、却很热的Prompt,接近16k人查看,核心是用二八法则来定位学习中的关键部分。 帕累托原则(Pareto principle)建议专注于 20% 的概念,这将...AI实用指令1年前060.3K
免费领取:微软 Windows 云桌面电脑,配置 6 核 12G 内存(非VPS)白嫖微软家的 Windows 云桌面,配置 6 核 12G 内存,不限次数。 体验下来非常丝滑,几乎一点延迟。 首先进入网址:https://learn.microsoft.com/zh-cn/tra...AI实操教程1年前048.2K
2024年度RAG清单,RAG应用策略100+ 回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图...AI知识库1年前057.6K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图...最新AI资源# AI开源项目# 文档提取与清洗1年前071.4K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手综合介绍 Claude Engineer 是一个由 Doriandarko 开发的交互式命令行界面(CLI),利用 Anthropic 的 Claude-3.5-Sonnet 模型来协助软件开发任务...最新AI资源# AI开源项目# AI本地化聊天应用# 智能体应用1年前067.6K
ZenUML:基于简单文本代码创建序列图和流程图综合介绍 ZenUML 是一个多平台的图表即代码解决方案,专注于创建序列图和流程图。它通过在浏览器中实时渲染图表,避免了服务器端交互的延迟,使用户的思维过程不被低效的拖放操作或缓慢的加载动画所打断。Z...最新AI资源# AI白板与信息图1年前069.5K
Ilya Sutskever在NeurIPS炸裂宣判:预训练将结束,数据压榨到头了推理是不可预测的,所以我们必须从令人难以置信的,不可预测的 AI 系统开始。 Ilya 终于现身了,而且一上来就有惊人之语。本周五,OpenAI 的前首席科学家 Ilya Sutskever 在全球 ...AI新闻1年前067.3K
微软新模型:Phi-4来了,14B参数媲美更大规模模型Phi-4 在仅有 140 亿(14B) 个参数的情况下,通过创新的训练方法和高质量的数据,展现出了媲美甚至超越一些更大规模模型的性能。本文将详细介绍 Phi-4 的架构、特点、训练方法,以及在实际应...AI新闻1年前052K
Best-of-N 越狱法:对输入内容进行简单的随机变形并反复尝试,就能让主流 AI 系统突破安全限制产生有害回应近年来,随着生成式 AI(Generative AI)和大语言模型(LLM)的迅速发展,其安全性和可靠性问题引起了广泛关注。一项最新研究发现了一种被称为 Best-of-N 越狱法 (简称 BoN)的...AI知识库1年前049.2K
Swarms:多智能体编排框架,企业级生产工具综合介绍 Swarms是一个企业级生产就绪的多代理编排框架,旨在通过高效的代理管理和任务处理来提升企业生产力。该框架支持多模型、多内存系统和自定义代理创建,提供了模块化设计和全面的日志记录功能,确保系...最新AI资源# AI开源项目# 智能体开发框架1年前056.3K
Rexera 的 AI 智能体如何通过 LangGraph 驱动质量控制了解 Rexera 如何迁移至 LangGraph,创建用于房地产业务流程的强大质量控制智能体,并显著提升其大语言模型(LLM)回复的准确性。 Rexera 正在通过利用 AI 自动化手动流程,彻底改...AI新闻1年前054.5K