AI个人学习
和实操指南
讯飞绘镜

AI知识 第3页

模型量化是什么:FP32, FP16, INT8, INT4 数据类型详解-首席AI分享圈

模型量化是什么:FP32, FP16, INT8, INT4 数据类型详解

导读 在人工智能科技的浩瀚星空中,深度学习模型以其卓越的性能,驱动着诸多领域的创新发展。然而,模型规模的持续膨胀,如同双刃剑,在提升性能的同时,也带来了算力需求与存储压力的剧增。特别是在资源受限的应...

Think&Cite:使用树搜索技术提升文本引用准确性-首席AI分享圈

Think&Cite:使用树搜索技术提升文本引用准确性

摘要 尽管大型语言模型(LLMs)表现出色,但它们容易产生幻觉并生成事实不准确的信息。这一挑战促使人们努力进行属性文本生成,促使LLMs生成包含支持证据的内容。在本文中,我们提出了一种名为Think&Cite的新...

LLM OCR 的局限性:光鲜外表下的文档解析难题-首席AI分享圈

LLM OCR 的局限性:光鲜外表下的文档解析难题

对于任何需要检索增强生成 (RAG) 系统的应用来说,将海量 PDF 文档变成机器能读懂的文本块(也就是 “PDF 分块”)都是个让人头疼的大难题。 市面上既有开源的方案,也有商业化的产品,但说实话,还没哪个方案能真...

DeepSeek R1 越狱:尝试突破 DeepSeek 的审查机制-首席AI分享圈

DeepSeek R1 越狱:尝试突破 DeepSeek 的审查机制

DeepSeek R1 官网越狱是非常好的实验环境,能触发到基本所有类型的审查机制,可以学习很多防御技巧,所以这是一篇大模型审查机制的学习文章,会带你看到历年来大模型越狱的示例。   大模型审查机制通常采用...

OpenAI o3-mini 系统说明书(中文)-首席AI分享圈

OpenAI o3-mini 系统说明书(中文)

原文:https://cdn.openai.com/o3-mini-system-card.pdf 1 引言 OpenAI o 模型系列使用大规模强化学习进行训练,以使用思维链进行推理。这些先进的推理能力为提高我们模型的安全性和稳健性提供了新的途径。特别是...

智能代理检索增强生成:Agentic RAG 技术综述-首席AI分享圈

智能代理检索增强生成:Agentic RAG 技术综述

摘要 大型语言模型(LLMs),如OpenAI的GPT-4、Google的PaLM和Meta的LLaMA,通过实现类人文本生成和自然语言理解,极大地改变了人工智能(AI)。然而,它们对静态训练数据的依赖限制了其响应动态、实时查询的能力...

LangGraph:基于有向无环图拓扑的AI Agent构建与执行框架-首席AI分享圈

LangGraph:基于有向无环图拓扑的AI Agent构建与执行框架

人工智能(AI)是一个迅速发展的领域。语言模型已经发展到能够让AI Agent执行复杂任务和做出复杂决策。然而,随着这些Agent的技能不断提升,支持它们的基础设施难以跟上。 LangGraph,这是一个革命性的库,旨在革...

CoRAG:利用MCTS(蒙特卡洛树)动态链式 RAG 模型-首席AI分享圈

CoRAG:利用MCTS(蒙特卡洛树)动态链式 RAG 模型

  CORAG 的主要贡献总结 CORAG(Cost-Constrained Retrieval Optimization for Retrieval-Augmented Generation)是一种创新的检索增强生成(RAG)系统,旨在解决现有 RAG 方法中的关键挑战。以下是 CORAG ...

大模型参数量如何计算?7B、13B、65B 究竟代表什么?-首席AI分享圈

大模型参数量如何计算?7B、13B、65B 究竟代表什么?

最近,许多从事大模型训练和推理的朋友都在讨论模型参数量和模型大小之间的关系。例如,著名的羊驼系列 LLaMA 大模型,就包含了 LLaMA-7B、LLaMA-13B、LLaMA-33B 和 LLaMA-65B 四种不同参数规模的版本。 这里的 “...

CLOB:仅使用提示词让大语言模型持续学习一系列任务-首席AI分享圈

CLOB:仅使用提示词让大语言模型持续学习一系列任务

原文:https://arxiv.org/pdf/2412.15479 解读:此文章本身创新不多,应用意义也不大。不过,让我想起很久很久以前阅读的三篇高含金量的文章,阅读此文结合之前的三篇文章,希望给大家带来更多灵感。推荐阅读:《...

向量数据库深度对比:Weaviate、Milvus 与 Qdrant-首席AI分享圈

向量数据库深度对比:Weaviate、Milvus 与 Qdrant

在人工智能和机器学习领域,尤其是在构建如 RAG(检索增强生成)系统和语义搜索等应用时,高效地处理和检索海量非结构化数据变得至关重要。向量数据库应运而生,成为解决这一挑战的核心技术。它们不仅是存储高维...

从 Cline 开始了解 AI Coding 工作原理-首席AI分享圈

从 Cline 开始了解 AI Coding 工作原理

没想到,AI 在编程领域掀起了半变天。从 v0 、bolt.new 再到各类结合 Agant 的编程工具 Cursor、Windsurf,AI Coding 已经具备 idea MVP 的巨大潜力。从传统的 AI 辅助编码,到如今的直接项目生成的背后,到底是...

zh_CN简体中文