AI个人学习
和实操指南

Trieve:提供搜索、推荐和分析的全方位RAG云基础设施

综合介绍

Trieve 是由 Devflow, Inc. 开发的全方位基础设施,专为搜索、推荐、RAG(检索增强生成)和分析而设计。该平台通过 API 提供服务,支持自托管,适用于 AWS、GCP、Kubernetes 和 Docker Compose 等环境。Trieve 集成了 OpenAI 和 Jina 的嵌入模型,提供语义向量搜索,并支持错别字容忍的全文本/神经搜索。其推荐系统能够根据用户行为提供个性化内容推荐,增强用户体验。Trieve 还支持多种过滤和分组功能,确保搜索结果的准确性和相关性。

Trieve:提供搜索、推荐和分析的全方位RAG云基础设施-1


 

Trieve:提供搜索、推荐和分析的全方位RAG云基础设施-1

开源PDF转Markdown(PDF2MD):https://github.com/devflowinc/trieve/tree/main/pdf2md

 

功能列表

  • 自托管:支持在 VPC 或本地环境中自托管,提供详细的自托管指南。
  • 语义向量搜索:集成 OpenAI 或 Jina 嵌入模型,提供高质量的语义向量搜索。
  • 错别字容忍搜索:使用 naver/efficient-splade-VI-BT-large-query 模型,提供错别字容忍的神经稀疏向量搜索。
  • 子句高亮:在搜索结果中高亮显示匹配的词或句子,提升用户体验。
  • 推荐系统:根据用户行为(如收藏、书签、点赞)提供个性化推荐。
  • RAG API 路由:集成 OpenRouter,提供多种 LLM 访问选项,支持主题记忆管理。
  • 混合搜索:使用 BAAI/bge-reranker-large 进行重排序优化,提供最佳搜索结果。
  • 新鲜度偏向:根据最新内容进行搜索结果偏向,防止结果陈旧。
  • 可调商品化:根据点击、加入购物车或引用等信号调整相关性。
  • 多种过滤:支持日期范围、子字符串匹配、标签、数值等多种过滤类型。
  • 分组功能:支持将多个块标记为同一文件的一部分,确保顶级结果不重复出现。

 

使用帮助

安装流程

  1. 准备环境:确保安装了必要的软件包,如 curl、gcc、g++、make、pkg-config、python3、libpq-dev、libssl-dev 等。
  2. 安装 NodeJS 和 Yarn:使用 NVM 安装 NodeJS LTS 版本,并全局安装 Yarn。
  3. 设置环境变量:复制 .env 文件到相应目录,并添加 OpenAI API 密钥。
  4. 启动 Docker 服务:使用 docker-compose 启动所需的容器服务。
  5. 本地开发:使用 tmuxp 或终端标签管理本地开发服务,启动各个模块。

使用指南

  1. 创建账户:访问本地服务器,创建账户并上传测试数据集。
  2. 搜索数据集:使用本地服务器进行数据集搜索,验证设置是否正常工作。
  3. 调试和支持:如遇到问题,可通过 Discord 获取支持,或使用 diesel::debugquery(&query).tostring() 调试 SQL 查询。

主要功能操作流程

  1. 语义向量搜索:上传数据后,系统会自动进行向量化处理,用户可以通过 API 进行语义搜索。
  2. 推荐系统:根据用户行为数据,系统会自动生成推荐内容,用户可以通过 API 获取推荐结果。
  3. RAG API 路由:用户可以选择不同的 LLM 进行 RAG 操作,系统会根据主题记忆管理提供最佳结果。
  4. 混合搜索:使用混合搜索功能,系统会自动进行重排序优化,提供最相关的搜索结果。
  5. 过滤和分组:用户可以根据需要设置不同的过滤条件和分组方式,确保搜索结果的准确性和相关性。

通过以上详细的安装和使用指南,用户可以轻松上手 Trieve 的各项功能,充分利用其强大的搜索、推荐和分析能力。

未经允许不得转载:首席AI分享圈 » Trieve:提供搜索、推荐和分析的全方位RAG云基础设施

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文