AI个人学习
和实操指南
讯飞绘镜

AI知识 第5页

Late Chunking×Milvus:如何提高RAG准确率-首席AI分享圈

Late Chunking×Milvus:如何提高RAG准确率

01.背景 在RAG应用开发中,第一步就是对于文档进行chunking(分块),高效的文档分块,可以有效的提高后续的召回内容的准确性。而对于如何高效的分块是个讨论的热点,有诸如固定大小分块,随机大小分块,滑动窗口...

Anthropic总结构建高效智能体简单且有效的方法-首席AI分享圈

Anthropic总结构建高效智能体简单且有效的方法

在过去的一年里,我们与多个行业中构建大语言模型 (LLM) 代理的团队合作。始终发现,最成功的实现并未使用复杂的框架或专用库,而是通过简单、可组合的模式构建完成。 在这篇文章中,我们将分享与客户合作以及自...

多为来自Anthropic的专家关于Prompt Engineering的讨论-首席AI分享圈

多为来自Anthropic的专家关于Prompt Engineering的讨论

AI总结 概述 AI 提示工程 的深入探讨,通过一个圆桌会议的形式,多位来自 Anthropic 的专家从研究、消费和企业等不同角度分享了他们对提示工程的理解和实践经验。 文章详细阐述了提示工程的定义、重要性、以及如...

Scaling Test-Time Compute:向量模型上的思维链-首席AI分享圈

Scaling Test-Time Compute:向量模型上的思维链

自从 OpenAI 发布了 o1 模型后,Scaling Test-Time Compute(扩展推理时计算)就成了 AI 圈子里最火爆的话题之一。简单来说,与其在预训练或后训练阶段疯狂堆算力,不如在推理阶段(也就是大语言模型生成输出的时...

2024年度RAG清单,RAG应用策略100+-首席AI分享圈

2024年度RAG清单,RAG应用策略100+

  回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图谱再创新机,年末图表理...

卷起来了!长文本向量模型分块策略大比拼-首席AI分享圈

卷起来了!长文本向量模型分块策略大比拼

长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利弊...

如何有效测试 LLM 提示词 - 从理论到实践的完整指南-首席AI分享圈

如何有效测试 LLM 提示词 - 从理论到实践的完整指南

  一、测试提示词的根本原因: LLM 对提示词高度敏感,细微的措辞变化可能导致显著不同的输出结果 未经测试的提示词可能产生: 事实错误的信息 不相关的回复 不必要的 API 成本浪费 二、系统化的提示词优化...

AI工程学院:1.提示工程

🚀 提示工程 提示工程(Prompt Engineering)是生成式 AI 时代的一项关键技能,这是一门设计有效指令来引导语言模型生成期望输出的艺术与科学。据 DataCamp 报道,这一新兴学科涉及设计和优化提示,以从 AI 模型(...

AI工程学院:2.1从零开始实现 RAG-首席AI分享圈

AI工程学院:2.1从零开始实现 RAG

概述 本指南将引导您使用纯 Python 创建一个简单的检索增强生成 (RAG) 系统。我们将使用一个嵌入模型和一个大语言模型 (LLM) 来检索相关文档并基于用户的查询生成回复。   https://github.com/adithya-s-k/A...

AI工程学院:2.2基本 RAG 实现-首席AI分享圈

AI工程学院:2.2基本 RAG 实现

介绍   检索增强生成 (RAG) 是一种强大的技术,它将大型语言模型的优势与从知识库中检索相关信息的能力相结合。这种方法通过将生成的响应建立在特定的检索信息上来提高生成响应的质量和准确性。a 本笔记本旨...

AI工程学院:2.3BM25 RAG (检索增强生成)-首席AI分享圈

AI工程学院:2.3BM25 RAG (检索增强生成)

简介 BM25 检索增强生成(BM25 RAG)是一种高级技术,将用于信息检索的 BM25(Best Matching 25)算法与大语言模型结合,用于文本生成。通过使用经过验证的概率检索模型,此方法可提高生成响应的准确性和相关性。...

AI工程学院:2.5RAG 系统评估-首席AI分享圈

AI工程学院:2.5RAG 系统评估

简介 评估是开发和优化检索增强生成(RAG)系统的关键环节。评估涉及对 RAG 流程各方面的性能、准确性和质量进行衡量,包括从检索效果到生成响应的相关性和真实性。   RAG 评估的重要性 对 RAG 系统进行有效...

AI工程学院:2.6RAG 可观察性- Arize Phoenix 设置

欢迎来到本笔记本,在这里我们将探索如何使用 Llama Index 设置和观察检索增强生成 (RAG) 流水线。 https://github.com/adithya-s-k/AI-Engineering.academy/tree/main/RAG/01_RAG_Observability   简介 本...

zh_CN简体中文