Trieve: un servicio completo de infraestructura en la nube RAG que proporciona búsquedas, recomendaciones y análisis.

Últimos recursos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

59.3K 00

Introducción general

Trieve es una infraestructura integral desarrollada por Devflow, Inc. y diseñada para búsquedas, recomendaciones, RAG (retrieval augmentation generation) y análisis. La plataforma se sirve a través de una API, es autoalojada y está disponible para entornos como AWS, GCP, Kubernetes y Docker Compose.Trieve integra OpenAI y el modelo de incrustación de Jina, proporciona búsqueda vectorial semántica y es compatible con la búsqueda de texto completo/neural tolerante a errores tipográficos. Su sistema de recomendación ofrece recomendaciones de contenido personalizadas basadas en el comportamiento del usuario para mejorar su experiencia, y Trieve admite múltiples funciones de filtrado y agrupación para garantizar la precisión y relevancia de los resultados de búsqueda.

PDF to Markdown de código abierto (PDF2MD): https://github.com/devflowinc/trieve/tree/main/pdf2md

Lista de funciones

autoalojado: Admite el autoalojamiento en entornos VPC o locales con guías detalladas de autoalojamiento.
búsqueda vectorial semántica: Integre modelos incrustados OpenAI o Jina para proporcionar una búsqueda vectorial semántica de alta calidad.
Búsqueda de tolerancia a errores tipográficos: Búsqueda neuronal de vectores dispersos tolerante a errores tipográficos mediante el modelo naver/efficient-splade-VI-BT-large-query.
resaltado de cláusulasMejora la experiencia del usuario resaltando las palabras o frases coincidentes en los resultados de búsqueda.
sistema de recomendaciónProporcionar recomendaciones personalizadas basadas en el comportamiento del usuario (por ejemplo, favoritos, marcadores, gustos).
Enrutamiento API RAG: OpenRouter integrado con múltiples opciones de acceso LLM y soporte para la gestión de memoria temática.
Búsqueda híbridaLa optimización de la reordenación con BAAI/bge-reranker-large proporciona los mejores resultados de búsqueda.
Sesgo de frescuraEvita los resultados obsoletos sesgando los resultados de búsqueda en función de los contenidos más recientes.
Comercialización ajustable: Ajuste la relevancia en función de señales como clics, añadir a la cesta o menciones.
Filtración múltipleSoporta rango de fechas, concordancia de subcadena, etiqueta, valor numérico y muchos otros tipos de filtro.
función de agrupación: La posibilidad de marcar varios bloques como parte del mismo archivo garantiza que no se dupliquen los mejores resultados.

Utilizar la ayuda

Proceso de instalación

Preparar el entornoAsegúrese de que están instalados los paquetes necesarios, como curl, gcc, g++, make, pkg-config, python3, libpq-dev, libssl-dev, etc.
Instalación de NodeJS y YarnInstala la versión LTS de NodeJS usando NVM e instala Yarn globalmente.
Configuración de variables de entornoCopia el archivo .env en el directorio correspondiente y añade la clave de la API de OpenAI.
Iniciar el servicio DockerInicie el servicio de contenedor requerido utilizando docker-compose.
desarrollo local: Utilice tmuxp o las pestañas del terminal para gestionar los servicios de desarrollo local e iniciar los módulos.

Normas de uso

Crear una cuentaVisite un servidor local, cree una cuenta y cargue un conjunto de datos de prueba.
Búsqueda de conjuntos de datosFunción: Realice una búsqueda de conjuntos de datos utilizando un servidor local para comprobar que la configuración funciona correctamente.
Depuración y asistenciaSi tienes problemas, obtén ayuda a través de Discord o utiliza diesel::debugquery(&query).tostring() depura las consultas SQL.

Funciones principales

búsqueda vectorial semánticaEl sistema: Tras cargar los datos, el sistema realizará automáticamente la vectorización, y el usuario podrá realizar búsquedas semánticas a través de la API.
sistema de recomendaciónRecomendación: a partir de los datos de comportamiento del usuario, el sistema generará automáticamente contenidos recomendados, y los usuarios podrán obtener los resultados recomendados a través de la API.
Enrutamiento API RAGLos usuarios pueden seleccionar diferentes LLM para el RAG funcionamiento, el sistema proporcionará los mejores resultados en función de la gestión de la memoria del sujeto.
Búsqueda híbridaBúsqueda híbrida: mediante la función de búsqueda híbrida, el sistema reordena y optimiza automáticamente para ofrecer los resultados de búsqueda más pertinentes.
Filtrado y agrupaciónLos usuarios pueden establecer diferentes filtros y agrupaciones según sea necesario para garantizar la precisión y pertinencia de los resultados de la búsqueda.

Gracias a la guía detallada de instalación y uso que figura más arriba, los usuarios podrán empezar a utilizar fácilmente las funciones de Trieve y aprovechar al máximo sus potentes capacidades de búsqueda, recomendación y análisis.

Últimos recursos sobre IA # AI Servicios abiertos # Extracción y limpieza de documentos

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Tafi: la forma más rápida de crear personajes 3D personalizados, AI Character Generation (en beta)

Últimos recursos sobre IA # AI Texto e Imagen a 3D

hace 1 año

055.4K

ResumeUp.AI: diálogo con la IA para generar el currículum y las cartas de presentación correspondientes al puesto de trabajo

Últimos recursos sobre IA # AI Asistente de Eficiencia Vital

hace 1 año

051.1K

FlashMLA：优化Hopper GPU的MLA解码内核（DeepSeek 开源周第一天）

FlashMLA: optimización de los núcleos de descodificación MLA para las GPU Hopper (Día 1 de la Semana del Código Abierto de DeepSeek)

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

062.5K

Droxy: una solución de atención al cliente inteligente multiplataforma para la generación de contactos

Últimos recursos sobre IA # Robot AI de atención al cliente

hace 1 año

053.1K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Trieve: un servicio completo de infraestructura en la nube RAG que proporciona búsquedas, recomendaciones y análisis.

Introducción general

Lista de funciones