综合介绍
R2R(RAG to Riches)是一个先进的AI检索系统,支持检索增强生成(RAG)功能,具备生产就绪的特性。该系统基于容器化的RESTful API构建,提供多模态内容解析、混合搜索功能、可配置的GraphRAG以及全面的用户和文档管理功能。R2R能够解析多种格式的内容,如文本、PDF、JSON、图片和音频文件,并结合语义和关键词搜索,实现更高的相关性检索。此外,R2R还支持自动提取实体和关系,构建知识图谱,并通过GraphRAG进行聚类和总结,为用户提供更丰富的洞察。
功能列表
- 多模态内容解析:支持解析文本、PDF、JSON、图片、音频等多种格式的内容。
- 混合搜索:结合语义和关键词搜索,通过互惠排名融合提高检索相关性。
- 知识图谱:自动提取实体和关系,构建知识图谱。
- GraphRAG:对创建的图进行聚类和总结,提供更丰富的洞察。
- 用户管理:高效管理文档和用户角色。
- 可观察性:监控和分析RAG引擎性能。
- 配置管理:使用直观的配置文件设置应用程序。
- 仪表板:基于React和Next.js的开源管理仪表板,通过GUI与R2R交互。
📊 GraphRAG:
GraphRAG 利用知识图谱中的社区检测和摘要功能扩展了传统的 RAG。通过了解信息在文档中的聚集和连接方式,这种方法可以提供更丰富的背景信息和更全面的答案。
使用帮助
安装流程
R2R可以通过Docker或pip快速安装。以下是详细的安装步骤:
使用pip安装
- 安装R2R核心包:
pip install r2r
- 配置环境变量:
export OPENAI_API_KEY=sk-...
export POSTGRES...
- 安装完整的R2R核心和依赖:
pip install 'r2r[core,ingestion-bundle]'
r2r --config-name=default serve
使用Docker安装
- 配置环境变量:
export OPENAI_API_KEY=sk-...
- 启动R2R及其依赖:
r2r serve --docker --full
功能操作指南
多模态内容解析
R2R支持解析多种格式的内容,包括文本、PDF、JSON、图片和音频文件。用户可以通过API上传这些文件,系统会自动解析并提取有用的信息。
混合搜索
R2R结合语义和关键词搜索,通过互惠排名融合提高检索相关性。用户可以通过API提交查询,系统会返回最相关的结果。
知识图谱
R2R能够自动提取实体和关系,构建知识图谱。用户可以通过API查看和管理这些知识图谱,获取更深入的洞察。
GraphRAG
GraphRAG功能允许用户对创建的图进行聚类和总结,提供更丰富的洞察。用户可以通过API配置和使用GraphRAG功能。
用户管理
R2R提供全面的用户和文档管理功能。用户可以通过仪表板或API管理文档和用户角色,确保系统的高效运行。
可观察性
R2R提供监控和分析RAG引擎性能的工具。用户可以通过仪表板查看系统性能指标,及时发现和解决问题。
配置管理
R2R使用直观的配置文件进行设置。用户可以根据需要修改配置文件,调整系统的各项参数。
仪表板
R2R提供基于React和Next.js的开源管理仪表板,用户可以通过GUI与R2R交互,管理和监控系统。