AI个人学习
和实操指南
讯飞绘镜

AI知识

模块化 RAG 系统中使用推理模型的应用评估-首席AI分享圈
置顶

模块化 RAG 系统中使用推理模型的应用评估

本文将介绍 Kapa.ai 近期在检索增强生成(Retrieval-Augmented Generation,简称 RAG)系统中,对 OpenAI 的 o3-mini 等推理模型进行探索的总结汇报。 Kapa.ai 是一款由大型语言模型(LLM)驱动的 AI 助手,它可...

AI知识
DeepRetrieval:强化学习驱动的高效信息检索查询生成-首席AI分享圈

DeepRetrieval:强化学习驱动的高效信息检索查询生成

摘要 信息检索系统对于有效访问大型文档集合至关重要。最近的方法利用大型语言模型(LLMs)通过查询增强来提高检索性能,但通常依赖于昂贵的监督学习或蒸馏技术,这些技术需要大量的计算资源和手工标注的数据。在...

OpenAI发布:大型语言模型如何监控自身的不当行为-首席AI分享圈

OpenAI发布:大型语言模型如何监控自身的不当行为

大型推理模型在有机会时会利用漏洞。研究表明,可以使用大型语言模型(LLM)监控其思维链(chains-of-thought, CoT)来检测这些利用行为。惩罚模型的“不良想法”并不能阻止大多数不当行为,反而会使其隐藏意图。 ...

[转载]QwQ-32B 的工具调用能力及 Agentic RAG 应用-首席AI分享圈

[转载]QwQ-32B 的工具调用能力及 Agentic RAG 应用

背景 近期,一篇名为 Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning 的论文 (arxiv.org/pdf/2503.09516) 引发了广泛关注。该论文提出了一种利用强化学习训练大语...

DeepSearch/DeepResearch中最优文本段选择和URL重排-首席AI分享圈

DeepSearch/DeepResearch中最优文本段选择和URL重排

如果你已经读过 Jina 上一篇经典长文《DeepSearch/DeepResearch 的设计与实现》,那么不妨再深挖一些能大幅提升回答质量的细节。这次,我们将重点关注两个细节: 从长网页提取最优文本段:如何利用迟分(late-chun...

Gemma 3 技术报告中文版-首席AI分享圈

Gemma 3 技术报告中文版

Gemma 3 关键信息总结 一、关键指标 参数 详情 模型规模 1 亿到 270 亿参数,共四个版本:1B、4B、12B、27B 架构 基于 Transformer 的解码器专用架构,继承自 Gemma 2,并进行多项改进 多模态能力 支持文本和图像...

IDProtector:保护人像照片免受AI生成技术滥用的方法-首席AI分享圈

IDProtector:保护人像照片免受AI生成技术滥用的方法

1. 背景与问题 随着人工智能(AI)技术的快速发展,尤其是扩散模型的进步,AI已经能够生成非常逼真的人像图片。例如,像InstantID这样的技术,只需要一张照片,就能生成具有相同身份特征的多个新图片。这种技术虽...

长文本向量模型在4K Tokens 之外形同盲区?-首席AI分享圈

长文本向量模型在4K Tokens 之外形同盲区?

2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使...

LangChain vs. LangGraph:官方告诉你该如何选择-首席AI分享圈

LangChain vs. LangGraph:官方告诉你该如何选择

当前生成式 AI 领域发展迅速,新的框架和技术层出不穷。因此,读者需要注意,本文所介绍的内容可能具有时效性。本文将深入探讨用于构建 LLM 应用程序的两个主流框架:LangChain 和 LangGraph,并分析它们的优劣,...

MCP Server、Function Call 与 Agent 的协同与差异-首席AI分享圈

MCP Server、Function Call 与 Agent 的协同与差异

在人工智能 (AI) 领域,特别是大型语言模型 (LLM) 蓬勃发展的今天,理解 MCP Server、Function Call 和 Agent 这三个关键概念至关重要。它们如同 AI 系统的基石,各自承担着独特而又相互关联的角色。 深入理解它...

GRPO 如何在“时间线索”游戏中超越 o1、o3-mini 及 R1-首席AI分享圈

GRPO 如何在“时间线索”游戏中超越 o1、o3-mini 及 R1

近年来,人工智能领域在推理能力上取得了显著进展。去年,OpenAI 展示了大型语言模型 (LLMs) 的强大推理潜力后,Google DeepMind、阿里巴巴、DeepSeek 和 Anthropic 等机构迅速跟进,利用强化学习 (RL) 技术训练...

Nexus:构建可扩展多智能体系统的新一代 Python 框架-首席AI分享圈

Nexus:构建可扩展多智能体系统的新一代 Python 框架

近年来,随着大型语言模型(LLM)的迅猛发展,多智能体系统(Multi-Agent Systems, MAS)的能力得到了显著提升。这些系统不仅能够自动化执行任务,还展现出接近人类的推理能力。然而,传统的 MAS 架构往往伴随着...

大模型关键参数解读:Token、上下文长度与输出限制-首席AI分享圈

大模型关键参数解读:Token、上下文长度与输出限制

大型语言模型 (LLM) 在人工智能领域扮演着越来越重要的角色。为了更好地理解和应用 LLM,我们需要深入了解其核心概念。本文将聚焦于 Token、最大输出长度和上下文长度这三个关键概念,帮助读者扫清理解障碍,从而...

Agentic AI、AI Agents与Agents:概念解释-首席AI分享圈

Agentic AI、AI Agents与Agents:概念解释

近期,自主型 AI (Agentic AI)、AI 智能体 (AI Agents) 和 智能体 (Agents) 这几个术语频繁出现在大众视野中。坦率地说,尽管身为数据分析师和科学家,业界人士过去对这些与 AI 相关的趋势和热词也曾感到有些抗拒...

AI Coding 编辑器:揭秘 Cline 的工作原理-首席AI分享圈

AI Coding 编辑器:揭秘 Cline 的工作原理

近年来,人工智能(AI)技术在编程领域引发了一场深刻的变革。从 v0、bolt.new,到集成 Agent 技术的编程工具如 Cursor 和 Windsurf,AI Coding 展现出了在软件开发流程中扮演关键角色的巨大潜力,尤其是在快速原...

zh_CN简体中文