
Deep Research 技术盘点!比RAG更高级的LLM应用范式
OpenAI 的 Deep Research 工具横空出世后,各大厂商都推出了自研的 Deep Research 工具。所谓Deep Research,是和普通搜索比较的,简单的RAG检索生成一般只有一轮检索。然而Deep Research可以像人类一样,根据一...
OpenAI 的 Deep Research 工具横空出世后,各大厂商都推出了自研的 Deep Research 工具。所谓Deep Research,是和普通搜索比较的,简单的RAG检索生成一般只有一轮检索。然而Deep Research可以像人类一样,根据一...
技术核心:Retrieval Interleaved Generation (RIG) 什么是 RIG? RIG 是一种创新的生成方法,旨在解决大语言模型在处理统计数据时的“幻觉”(hallucination)问题。传统模型可能会凭空生成不准确的数字或事实,而...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
如果你的 RAG 应用未能达到预期效果,或许是时候重新审视你的分块策略了。更好的分块意味着更精准的检索,最终带来更高质量的回复。 然而,分块技术并非“一招鲜吃遍天”,没有哪一种方法是绝对最优的。你需要根据...
引言 在大型语言模型 (LLMs) 的应用领域,尤其是在检索增强生成 (RAG) 系统中,文本分块 (Chunking) 扮演着至关重要的角色。 文本分块的质量直接关系到上下文信息的有效性,进而影响 LLM 生成答案的准确性和完整...
速读 智能体记忆的挑战与Zep的创新 智能体(AI Agents)在复杂任务中面临记忆瓶颈。传统基于大型语言模型(LLM)的智能体受限于上下文窗口,难以有效整合长期对话历史和动态数据,限制了表现并易产生幻觉。Zep 是...
在人工智能和大型语言模型 (LLMs) 领域,Ollama 框架的出现无疑吸引了众多目光。这款开源框架专注于简化大型语言模型在本地的部署和运行,让更多开发者能够轻松体验 LLM 的魅力。然而,放眼市场,Ollama 并非孤军...
在人工智能领域,模型的选择至关重要。OpenAI 作为行业领导者,提供了两种主要类型的模型系列:推理模型 (Reasoning Models) 和 GPT 模型 (GPT Models)。前者以 o 系列模型为代表,例如 o1 和 o3-mini;后者则以 ...
发现一篇好玩的论文《Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs》,主题是分析o1 类推理模型 思考路径频繁切换、思维缺乏聚焦,简称为“思考不足”(underthinking),同时给出缓解...
导读 在人工智能科技的浩瀚星空中,深度学习模型以其卓越的性能,驱动着诸多领域的创新发展。然而,模型规模的持续膨胀,如同双刃剑,在提升性能的同时,也带来了算力需求与存储压力的剧增。特别是在资源受限的应...
摘要 尽管大型语言模型(LLMs)表现出色,但它们容易产生幻觉并生成事实不准确的信息。这一挑战促使人们努力进行属性文本生成,促使LLMs生成包含支持证据的内容。在本文中,我们提出了一种名为Think&Cite的新...
导读 本文档旨在通过一系列提示词示例(部分),帮助读者快速理解并掌握提示词工程的核心概念与应用。这些示例均源自于一篇关于提示工程技术系统综述的学术论文(《The Prompt Report: A Systematic Survey of Pr...
《Titans: Learning to Memorize at Test Time》原文:https://arxiv.org/pdf/2501.00663v1 Titans 架构 非官方实现:https://github.com/lucidrains/titans-pytorch 一、 研究背景与动机:Transformer 的...
对于任何需要检索增强生成 (RAG) 系统的应用来说,将海量 PDF 文档变成机器能读懂的文本块(也就是 “PDF 分块”)都是个让人头疼的大难题。 市面上既有开源的方案,也有商业化的产品,但说实话,还没哪个方案能真...
DeepSeek R1 官网越狱是非常好的实验环境,能触发到基本所有类型的审查机制,可以学习很多防御技巧,所以这是一篇大模型审查机制的学习文章,会带你看到历年来大模型越狱的示例。 大模型审查机制通常采用...
原文:https://cdn.openai.com/o3-mini-system-card.pdf 1 引言 OpenAI o 模型系列使用大规模强化学习进行训练,以使用思维链进行推理。这些先进的推理能力为提高我们模型的安全性和稳健性提供了新的途径。特别是...
文章速读 文章全面而深入地探讨了 大语言模型 (LLM) 规模定律(缩放法则/Scaling Law)的前世今生,以及 AI 研究的未来方向。作者 Cameron R. Wolfe 以清晰的逻辑和丰富的例证,带领读者从基础概念出发,逐步深入...
摘要 大型语言模型(LLMs),如OpenAI的GPT-4、Google的PaLM和Meta的LLaMA,通过实现类人文本生成和自然语言理解,极大地改变了人工智能(AI)。然而,它们对静态训练数据的依赖限制了其响应动态、实时查询的能力...
人工智能(AI)是一个迅速发展的领域。语言模型已经发展到能够让AI Agent执行复杂任务和做出复杂决策。然而,随着这些Agent的技能不断提升,支持它们的基础设施难以跟上。 LangGraph,这是一个革命性的库,旨在革...
介绍 和许多其他人一样,在过去几天里,我的新闻推送充斥着关于中国制造的 DeepSeek-R1 大语言模型的新闻、赞扬、抱怨和猜测,该模型于上周发布。该模型本身正被拿来与 OpenAI、Meta 等公司的一些最佳推理模型进...