AI个人学习
和实操指南
豆包Marscode1

AI知识 第5页

OpenAI-o3 与 Monte-Carlo 思想-首席AI分享圈

OpenAI-o3 与 Monte-Carlo 思想

o3 来了,分享一些个人的浅见。关于 Test-time Scaling Law 的进展,比我们想象中的要快得多。但我想说的是,这条路其实有些曲折——它是 OpenAI 在追求 AGI 的道路上,采取的曲线救国之策。 强化学习与捷径思维 为...

如何为RAG应用选择最佳Embedding模型-首席AI分享圈

如何为RAG应用选择最佳Embedding模型

向量Embedding是目前检索增强生成(RAG)应用程序的核心。它们捕获数据对象(如文本,图像等)的语义信息,并以数字数组表示。在时下的生成式AI应用中,这些向量Embedding通常由Embedding模型生成。如何为RAG应用...

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化-首席AI分享圈

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化

前言 在过去两年中,检索增强生成(RAG,Retrieval-Augmented Generation)技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力,RAG能够引入外部知识,从而为大模型在复杂场景中的应用提供更多...

2025年值得入坑的 AI Agent 五大框架-首席AI分享圈

2025年值得入坑的 AI Agent 五大框架

Agent 目前我见到的最多的翻译是“智能体”,但是直译是“代理”。 那 Agentic 又要翻译成什么呢?我感觉“代理型”这样的词更合适。 所以为了不让读者混淆,我在本文直接用英文表示。   随着 LLM 的发展,AI 的能...

小白也能看懂的大模型微调知识点-首席AI分享圈

小白也能看懂的大模型微调知识点

大模型微调全流程   建议在微调过程中严格按照以上流程执行,避免跳步,否则可能导致无效劳动。比如,如果没有充分构建数据集,最终发现微调模型效果不佳是数据集质量的问题,那么前期的努力将付诸东流,事...

万字长文梳理基于LLM的Text-to-SQL发展进程-首席AI分享圈

万字长文梳理基于LLM的Text-to-SQL发展进程

OlaChat AI数智助手万字长文深度解析,带你了解Text-to-SQL技术的前世今生。 论文:Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL 从自然语言问题(文本到SQL)生成准确的SQL是一个长...

Late Chunking×Milvus:如何提高RAG准确率-首席AI分享圈

Late Chunking×Milvus:如何提高RAG准确率

01.背景 在RAG应用开发中,第一步就是对于文档进行chunking(分块),高效的文档分块,可以有效的提高后续的召回内容的准确性。而对于如何高效的分块是个讨论的热点,有诸如固定大小分块,随机大小分块,滑动窗口...

Anthropic总结构建高效智能体简单且有效的方法-首席AI分享圈

Anthropic总结构建高效智能体简单且有效的方法

在过去的一年里,我们与多个行业中构建大语言模型 (LLM) 代理的团队合作。始终发现,最成功的实现并未使用复杂的框架或专用库,而是通过简单、可组合的模式构建完成。 在这篇文章中,我们将分享与客户合作以及自...

多为来自Anthropic的专家关于Prompt Engineering的讨论-首席AI分享圈

多为来自Anthropic的专家关于Prompt Engineering的讨论

AI总结 概述 AI 提示工程 的深入探讨,通过一个圆桌会议的形式,多位来自 Anthropic 的专家从研究、消费和企业等不同角度分享了他们对提示工程的理解和实践经验。 文章详细阐述了提示工程的定义、重要性、以及如...

Scaling Test-Time Compute:向量模型上的思维链-首席AI分享圈

Scaling Test-Time Compute:向量模型上的思维链

自从 OpenAI 发布了 o1 模型后,Scaling Test-Time Compute(扩展推理时计算)就成了 AI 圈子里最火爆的话题之一。简单来说,与其在预训练或后训练阶段疯狂堆算力,不如在推理阶段(也就是大语言模型生成输出的时...

2024年度RAG清单,RAG应用策略100+-首席AI分享圈

2024年度RAG清单,RAG应用策略100+

  回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图谱再创新机,年末图表理...

卷起来了!长文本向量模型分块策略大比拼-首席AI分享圈

卷起来了!长文本向量模型分块策略大比拼

长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利弊...

如何有效测试 LLM 提示词 - 从理论到实践的完整指南-首席AI分享圈

如何有效测试 LLM 提示词 - 从理论到实践的完整指南

  一、测试提示词的根本原因: LLM 对提示词高度敏感,细微的措辞变化可能导致显著不同的输出结果 未经测试的提示词可能产生: 事实错误的信息 不相关的回复 不必要的 API 成本浪费 二、系统化的提示词优化...

AI工程学院:1.提示工程

🚀 提示工程 提示工程(Prompt Engineering)是生成式 AI 时代的一项关键技能,这是一门设计有效指令来引导语言模型生成期望输出的艺术与科学。据 DataCamp 报道,这一新兴学科涉及设计和优化提示,以从 AI 模型(...

AI工程学院:2.1从零开始实现 RAG-首席AI分享圈

AI工程学院:2.1从零开始实现 RAG

概述 本指南将引导您使用纯 Python 创建一个简单的检索增强生成 (RAG) 系统。我们将使用一个嵌入模型和一个大语言模型 (LLM) 来检索相关文档并基于用户的查询生成回复。   https://github.com/adithya-s-k/A...

AI工程学院:2.2基本 RAG 实现-首席AI分享圈

AI工程学院:2.2基本 RAG 实现

介绍   检索增强生成 (RAG) 是一种强大的技术,它将大型语言模型的优势与从知识库中检索相关信息的能力相结合。这种方法通过将生成的响应建立在特定的检索信息上来提高生成响应的质量和准确性。a 本笔记本旨...

AI工程学院:2.3BM25 RAG (检索增强生成)-首席AI分享圈

AI工程学院:2.3BM25 RAG (检索增强生成)

简介 BM25 检索增强生成(BM25 RAG)是一种高级技术,将用于信息检索的 BM25(Best Matching 25)算法与大语言模型结合,用于文本生成。通过使用经过验证的概率检索模型,此方法可提高生成响应的准确性和相关性。...

zh_CN简体中文