AI个人学习
和实操指南
讯飞绘镜

AI知识 第4页

CoRAG:利用MCTS(蒙特卡洛树)动态链式 RAG 模型-首席AI分享圈

CoRAG:利用MCTS(蒙特卡洛树)动态链式 RAG 模型

  CORAG 的主要贡献总结 CORAG(Cost-Constrained Retrieval Optimization for Retrieval-Augmented Generation)是一种创新的检索增强生成(RAG)系统,旨在解决现有 RAG 方法中的关键挑战。以下是 CORAG ...

大模型参数量如何计算?7B、13B、65B 究竟代表什么?-首席AI分享圈

大模型参数量如何计算?7B、13B、65B 究竟代表什么?

最近,许多从事大模型训练和推理的朋友都在讨论模型参数量和模型大小之间的关系。例如,著名的羊驼系列 LLaMA 大模型,就包含了 LLaMA-7B、LLaMA-13B、LLaMA-33B 和 LLaMA-65B 四种不同参数规模的版本。 这里的 “...

CLOB:仅使用提示词让大语言模型持续学习一系列任务-首席AI分享圈

CLOB:仅使用提示词让大语言模型持续学习一系列任务

原文:https://arxiv.org/pdf/2412.15479 解读:此文章本身创新不多,应用意义也不大。不过,让我想起很久很久以前阅读的三篇高含金量的文章,阅读此文结合之前的三篇文章,希望给大家带来更多灵感。推荐阅读:《...

向量数据库深度对比:Weaviate、Milvus 与 Qdrant-首席AI分享圈

向量数据库深度对比:Weaviate、Milvus 与 Qdrant

在人工智能和机器学习领域,尤其是在构建如 RAG(检索增强生成)系统和语义搜索等应用时,高效地处理和检索海量非结构化数据变得至关重要。向量数据库应运而生,成为解决这一挑战的核心技术。它们不仅是存储高维...

从 Cline 开始了解 AI Coding 工作原理-首席AI分享圈

从 Cline 开始了解 AI Coding 工作原理

没想到,AI 在编程领域掀起了半变天。从 v0 、bolt.new 再到各类结合 Agant 的编程工具 Cursor、Windsurf,AI Coding 已经具备 idea MVP 的巨大潜力。从传统的 AI 辅助编码,到如今的直接项目生成的背后,到底是...

工作流(Workflow):一文读懂工作流的运行原理-首席AI分享圈

工作流(Workflow):一文读懂工作流的运行原理

开始之前,先了解几个“关键词”: 工作流 (Workflow): 简单说,就是 “完成一件事的完整步骤”。 它像一份“说明书”,告诉你为了达成目标,需要做什么、按什么顺序做、谁来做。 输入 (Input): 工作流开始前,你需要...

一小时内将 Cursor 变成 Devin,并了解两者的差异

本文是“理解和部署智能体 AI”系列的一部分: 智能体 AI 系列 1:Devin 和 Agent Cursor 之间的比较 智能体 AI 系列 2:从思考者到执行者 —— 智能体 AI 的范式革命和技术架构 智能体 AI 系列 3:将 20 美元变成 50...

实现 LLM 记忆系统的五种方式-首席AI分享圈

实现 LLM 记忆系统的五种方式

在构建大语言模型(LLM)应用时,记忆系统是提升对话上下文管理、长期信息存储以及语义理解能力的关键技术之一。一个高效的记忆系统可以帮助模型在长时间对话中保持一致性,提取关键信息,甚至具备检索历史对话的...

OpenAI 函数调用(Function calling)-首席AI分享圈

OpenAI 函数调用(Function calling)

OpenAI Function calling V2 特点 Function calling V2 的核心目标是赋予 OpenAI 模型与外部世界交互的能力,主要体现在以下两个核心功能: 数据获取 (Fetching Data) - RAG 的函数调用实现: 本质是 RAG (检索增...

Retrieval:什么是Retrieval?解释RAG中常见的

Retrieval:什么是Retrieval?解释RAG中常见的"检索"技术

基本概念 在信息技术领域,检索 (Retrieval) 指的是从一个大型数据集(通常是文档、网页、图像、音频、视频或其他形式的信息)中,根据用户的查询或需求,高效地定位和提取相关信息的过程。 其核心目标是找到与用...

CAG:比RAG快40倍的缓存增强生成方法-首席AI分享圈

CAG:比RAG快40倍的缓存增强生成方法

比RAG(检索增强生成)快40倍的CAG(缓存增强生成)。CAG彻底改变了知识获取方式:不再是实时检索外部数据,而是预先将所有知识加载到模型上下文中。这就像是把一个巨大的图书馆浓缩成了一本随身携带的工具书,需要时...

谷歌Agents与基础应用白皮书(中文版)-首席AI分享圈

谷歌Agents与基础应用白皮书(中文版)

作者:Julia Wiesinger,Patrick Marlow和 Vladimir Vuskovic 原文:https://www.kaggle.com/whitepaper-agents   目录 简介 什么是智能体? 模型 工具 编排层 智能体与模型 认知架构:智能体如何运作 工具...

2023年老文回顾:RAG 系统构建流程与评估指南-首席AI分享圈

2023年老文回顾:RAG 系统构建流程与评估指南

检索增强生成(Retrieval Augmented Generation,RAG)正在成为大语言模型(LLM)和向量数据库最受欢迎的应用之一。RAG 是通过从向量数据库(例如 Weaviate)检索的上下文增强对大语言模型输入的过程。RAG 应用通...

走近多智能体系统(MAS):协同合作的 AI 世界-首席AI分享圈

走近多智能体系统(MAS):协同合作的 AI 世界

多智能体系统 (Multi-Agent System, MAS) 是一个由多个交互的智能体 (Intelligent Agent) 组成的计算系统。多智能体系统可用于解决单个智能体或单体系统难以解决或无法解决的问题。智能体可以是机器人、人、或软...

zh_CN简体中文