AI个人学习
和实操指南
讯飞绘镜

AI知识 第4页

工作流(Workflow):一文读懂工作流的运行原理-首席AI分享圈

工作流(Workflow):一文读懂工作流的运行原理

开始之前,先了解几个“关键词”: 工作流 (Workflow): 简单说,就是 “完成一件事的完整步骤”。 它像一份“说明书”,告诉你为了达成目标,需要做什么、按什么顺序做、谁来做。 输入 (Input): 工作流开始前,你需要...

一小时内将 Cursor 变成 Devin,并了解两者的差异

本文是“理解和部署智能体 AI”系列的一部分: 智能体 AI 系列 1:Devin 和 Agent Cursor 之间的比较 智能体 AI 系列 2:从思考者到执行者 —— 智能体 AI 的范式革命和技术架构 智能体 AI 系列 3:将 20 美元变成 50...

实现 LLM 记忆系统的五种方式-首席AI分享圈

实现 LLM 记忆系统的五种方式

在构建大语言模型(LLM)应用时,记忆系统是提升对话上下文管理、长期信息存储以及语义理解能力的关键技术之一。一个高效的记忆系统可以帮助模型在长时间对话中保持一致性,提取关键信息,甚至具备检索历史对话的...

OpenAI 函数调用(Function calling)-首席AI分享圈

OpenAI 函数调用(Function calling)

OpenAI Function calling V2 特点 Function calling V2 的核心目标是赋予 OpenAI 模型与外部世界交互的能力,主要体现在以下两个核心功能: 数据获取 (Fetching Data) - RAG 的函数调用实现: 本质是 RAG (检索增...

Retrieval:什么是Retrieval?解释RAG中常见的

Retrieval:什么是Retrieval?解释RAG中常见的"检索"技术

基本概念 在信息技术领域,检索 (Retrieval) 指的是从一个大型数据集(通常是文档、网页、图像、音频、视频或其他形式的信息)中,根据用户的查询或需求,高效地定位和提取相关信息的过程。 其核心目标是找到与用...

CAG:比RAG快40倍的缓存增强生成方法-首席AI分享圈

CAG:比RAG快40倍的缓存增强生成方法

比RAG(检索增强生成)快40倍的CAG(缓存增强生成)。CAG彻底改变了知识获取方式:不再是实时检索外部数据,而是预先将所有知识加载到模型上下文中。这就像是把一个巨大的图书馆浓缩成了一本随身携带的工具书,需要时...

谷歌Agents与基础应用白皮书(中文版)-首席AI分享圈

谷歌Agents与基础应用白皮书(中文版)

作者:Julia Wiesinger,Patrick Marlow和 Vladimir Vuskovic 原文:https://www.kaggle.com/whitepaper-agents   目录 简介 什么是智能体? 模型 工具 编排层 智能体与模型 认知架构:智能体如何运作 工具...

2023年老文回顾:RAG 系统构建流程与评估指南-首席AI分享圈

2023年老文回顾:RAG 系统构建流程与评估指南

检索增强生成(Retrieval Augmented Generation,RAG)正在成为大语言模型(LLM)和向量数据库最受欢迎的应用之一。RAG 是通过从向量数据库(例如 Weaviate)检索的上下文增强对大语言模型输入的过程。RAG 应用通...

走近多智能体系统(MAS):协同合作的 AI 世界-首席AI分享圈

走近多智能体系统(MAS):协同合作的 AI 世界

多智能体系统 (Multi-Agent System, MAS) 是一个由多个交互的智能体 (Intelligent Agent) 组成的计算系统。多智能体系统可用于解决单个智能体或单体系统难以解决或无法解决的问题。智能体可以是机器人、人、或软...

OpenAI-o3 与 Monte-Carlo 思想-首席AI分享圈

OpenAI-o3 与 Monte-Carlo 思想

o3 来了,分享一些个人的浅见。关于 Test-time Scaling Law 的进展,比我们想象中的要快得多。但我想说的是,这条路其实有些曲折——它是 OpenAI 在追求 AGI 的道路上,采取的曲线救国之策。 强化学习与捷径思维 为...

如何为RAG应用选择最佳Embedding模型-首席AI分享圈

如何为RAG应用选择最佳Embedding模型

向量Embedding是目前检索增强生成(RAG)应用程序的核心。它们捕获数据对象(如文本,图像等)的语义信息,并以数字数组表示。在时下的生成式AI应用中,这些向量Embedding通常由Embedding模型生成。如何为RAG应用...

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化-首席AI分享圈

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化

前言 在过去两年中,检索增强生成(RAG,Retrieval-Augmented Generation)技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力,RAG能够引入外部知识,从而为大模型在复杂场景中的应用提供更多...

2025年值得入坑的 AI Agent 五大框架-首席AI分享圈

2025年值得入坑的 AI Agent 五大框架

Agent 目前我见到的最多的翻译是“智能体”,但是直译是“代理”。 那 Agentic 又要翻译成什么呢?我感觉“代理型”这样的词更合适。 所以为了不让读者混淆,我在本文直接用英文表示。   随着 LLM 的发展,AI 的能...

小白也能看懂的大模型微调知识点-首席AI分享圈

小白也能看懂的大模型微调知识点

大模型微调全流程   建议在微调过程中严格按照以上流程执行,避免跳步,否则可能导致无效劳动。比如,如果没有充分构建数据集,最终发现微调模型效果不佳是数据集质量的问题,那么前期的努力将付诸东流,事...

万字长文梳理基于LLM的Text-to-SQL发展进程-首席AI分享圈

万字长文梳理基于LLM的Text-to-SQL发展进程

OlaChat AI数智助手万字长文深度解析,带你了解Text-to-SQL技术的前世今生。 论文:Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL 从自然语言问题(文本到SQL)生成准确的SQL是一个长...

zh_CN简体中文