Trieve: облачная инфраструктура RAG с полным спектром услуг, обеспечивающая поиск, рекомендации и аналитику
Общее введение
Trieve - это всеобъемлющая инфраструктура, разработанная компанией Devflow, Inc. и предназначенная для поиска, рекомендаций, RAG (генерации дополнений к поиску) и аналитики. Платформа обслуживается через API, является самодостаточной и доступна для таких сред, как AWS, GCP, Kubernetes и Docker Compose. Trieve интегрирует OpenAI и модель встраивания Jina, обеспечивает семантический векторный поиск и поддерживает полнотекстовый/нейронный поиск, устойчивый к опечаткам. Его рекомендательная система обеспечивает персонализированные рекомендации контента на основе поведения пользователей для повышения удобства работы с ним. Trieve поддерживает множество функций фильтрации и группировки для обеспечения точности и релевантности результатов поиска.


PDF в Markdown с открытым исходным кодом (PDF2MD): https://github.com/devflowinc/trieve/tree/main/pdf2md
Список функций
- самостоятельный хостинг: Поддержка самостоятельного хостинга в VPC или локальных средах с подробными руководствами по самостоятельному хостингу.
- семантический векторный поиск: Интеграция встроенных моделей OpenAI или Jina для обеспечения высококачественного семантического векторного поиска.
- Поиск допустимых опечаток: Обеспечение толерантного к опечаткам нейронного поиска разреженных векторов с использованием модели naver/efficient-splade-VI-BT-large-query.
- выделение пунктов: Повысьте удобство использования, выделяя совпадающие слова или предложения в результатах поиска.
- рекомендательная система: Предоставление персонализированных рекомендаций на основе поведения пользователя (например, избранное, закладки, "нравится").
- Маршрутизация API RAG: Интегрируется с OpenRouter, предоставляет несколько вариантов доступа к LLM и поддерживает управление памятью тем.
- Гибридный поиск: Оптимизация упорядочивания с помощью BAAI/bge-reranker-large обеспечивает наилучшие результаты поиска.
- Предвзятое отношение к свежести: Предотвращайте появление неактуальных результатов, ориентируясь на самое свежее содержимое.
- Регулируемая коммерциализация: Регулируйте релевантность на основе таких сигналов, как клики, добавление в корзину или цитирование.
- Многократная фильтрацияПоддержка диапазона дат, совпадения подстрок, меток, числовых значений и многих других типов фильтров.
- функция группировки: Поддержка маркировки нескольких блоков как части одного файла гарантирует, что лучшие результаты не будут дублироваться.
Использование помощи
Процесс установки
- Подготовка среды: Убедитесь, что установлены необходимые пакеты, такие как curl, gcc, g++, make, pkg-config, python3, libpq-dev, libssl-dev и т.д.
- Установка NodeJS и Yarn: Установите версию NodeJS LTS с помощью NVM и установите Yarn глобально.
- Установка переменных окружения: Скопируйте файл .env в соответствующую директорию и добавьте ключ API OpenAI.
- Запуск службы Docker: Запустите необходимый контейнерный сервис с помощью docker-compose.
- местное развитие: Используйте tmuxp или вкладки терминала для управления локальными службами разработки и запуска модулей.
Руководство по использованию
- Создать учетную запись: Зайдите на локальный сервер, создайте учетную запись и загрузите тестовый набор данных.
- Поиск наборов данных: Выполните поиск по набору данных с помощью локального сервера, чтобы убедиться в правильности настройки.
- Отладка и поддержка: Если у вас возникнут проблемы, обратитесь за поддержкой в Discord или используйте diesel::debugquery(&query).tostring() отлаживает SQL-запросы.
Основные функции
- семантический векторный поиск: После загрузки данных система автоматически выполнит векторизацию, а пользователь сможет осуществлять семантический поиск через API.
- рекомендательная система: На основе данных о поведении пользователей система будет автоматически генерировать рекомендуемый контент, а пользователи смогут получать рекомендованные результаты через API.
- Маршрутизация API RAG: Пользователи могут выбирать различные LLM для RAG система обеспечит наилучшие результаты, основываясь на управлении памятью.
- Гибридный поиск: Используя функцию гибридного поиска, система автоматически упорядочивает и оптимизирует результаты поиска, чтобы обеспечить их наибольшую релевантность.
- Фильтрация и группировкаПользователи могут устанавливать различные фильтры и группировки по мере необходимости, чтобы обеспечить точность и релевантность результатов поиска.
С помощью подробного руководства по установке и использованию пользователи смогут легко начать работу с функциями Trieve и воспользоваться всеми преимуществами его мощных возможностей поиска, рекомендаций и анализа.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...