综合介绍
Trieve 是由 Devflow, Inc. 开发的全方位基础设施,专为搜索、推荐、RAG(检索增强生成)和分析而设计。该平台通过 API 提供服务,支持自托管,适用于 AWS、GCP、Kubernetes 和 Docker Compose 等环境。Trieve 集成了 OpenAI 和 Jina 的嵌入模型,提供语义向量搜索,并支持错别字容忍的全文本/神经搜索。其推荐系统能够根据用户行为提供个性化内容推荐,增强用户体验。Trieve 还支持多种过滤和分组功能,确保搜索结果的准确性和相关性。
功能列表
- 自托管:支持在 VPC 或本地环境中自托管,提供详细的自托管指南。
- 语义向量搜索:集成 OpenAI 或 Jina 嵌入模型,提供高质量的语义向量搜索。
- 错别字容忍搜索:使用 naver/efficient-splade-VI-BT-large-query 模型,提供错别字容忍的神经稀疏向量搜索。
- 子句高亮:在搜索结果中高亮显示匹配的词或句子,提升用户体验。
- 推荐系统:根据用户行为(如收藏、书签、点赞)提供个性化推荐。
- RAG API 路由:集成 OpenRouter,提供多种 LLM 访问选项,支持主题记忆管理。
- 混合搜索:使用 BAAI/bge-reranker-large 进行重排序优化,提供最佳搜索结果。
- 新鲜度偏向:根据最新内容进行搜索结果偏向,防止结果陈旧。
- 可调商品化:根据点击、加入购物车或引用等信号调整相关性。
- 多种过滤:支持日期范围、子字符串匹配、标签、数值等多种过滤类型。
- 分组功能:支持将多个块标记为同一文件的一部分,确保顶级结果不重复出现。
使用帮助
安装流程
- 准备环境:确保安装了必要的软件包,如 curl、gcc、g++、make、pkg-config、python3、libpq-dev、libssl-dev 等。
- 安装 NodeJS 和 Yarn:使用 NVM 安装 NodeJS LTS 版本,并全局安装 Yarn。
- 设置环境变量:复制 .env 文件到相应目录,并添加 OpenAI API 密钥。
- 启动 Docker 服务:使用 docker-compose 启动所需的容器服务。
- 本地开发:使用 tmuxp 或终端标签管理本地开发服务,启动各个模块。
使用指南
- 创建账户:访问本地服务器,创建账户并上传测试数据集。
- 搜索数据集:使用本地服务器进行数据集搜索,验证设置是否正常工作。
- 调试和支持:如遇到问题,可通过 Discord 获取支持,或使用 diesel::debugquery(&query).tostring() 调试 SQL 查询。
主要功能操作流程
- 语义向量搜索:上传数据后,系统会自动进行向量化处理,用户可以通过 API 进行语义搜索。
- 推荐系统:根据用户行为数据,系统会自动生成推荐内容,用户可以通过 API 获取推荐结果。
- RAG API 路由:用户可以选择不同的 LLM 进行 RAG 操作,系统会根据主题记忆管理提供最佳结果。
- 混合搜索:使用混合搜索功能,系统会自动进行重排序优化,提供最相关的搜索结果。
- 过滤和分组:用户可以根据需要设置不同的过滤条件和分组方式,确保搜索结果的准确性和相关性。
通过以上详细的安装和使用指南,用户可以轻松上手 Trieve 的各项功能,充分利用其强大的搜索、推荐和分析能力。