MiniRAG: Marco de Generación Mejorada de Recuperación Simplificada, Índice de Grafos de Entidades Recupera Bloques de Texto Relevantes

Últimos recursos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

58.1K 00

Introducción general

MiniRAG es un marco de Generación Aumentada de Recuperación (RAG) extremadamente sencillo que pretende lograr un buen rendimiento de la RAG incluso para modelos pequeños mediante la indexación de grafos heterogéneos y la recuperación mejorada por topología ligera. Desarrollado por el Laboratorio de Ciencia de Datos de la Universidad de Hong Kong (HKUDS), el proyecto se centra en resolver el problema de degradación del rendimiento al que se enfrentan los modelos lingüísticos pequeños (SLM) en los marcos RAG existentes. miniRAG reduce la dependencia de la comprensión semántica compleja combinando trozos de texto y entidades con nombre en una única estructura unificada, y explota las estructuras de grafos para un descubrimiento eficiente del conocimiento. El marco logra un rendimiento comparable con sólo 251 TP3T de espacio de almacenamiento del enfoque de modelo lingüístico amplio (LLM).

Lista de funciones

Mecanismo de indexación de grafos heterogéneos: combinación de bloques de texto y entidades con nombre para reducir la dependencia de la comprensión semántica compleja.
Lightweight topology-enhanced retrieval: efficient knowledge discovery using graph structures.
Compatible con modelos lingüísticos pequeños: proporciona un rendimiento eficaz de la GAR en escenarios con recursos limitados.
Completo conjunto de datos de referencia: se proporciona el conjunto de datos LiHua-World para evaluar el rendimiento de los sistemas RAG ligeros en consultas complejas.
Fácil instalación: admite la instalación desde el código fuente y PyPI.

Utilizar la ayuda

Proceso de instalación

Instalación desde la fuente (recomendada)

Clonación del repositorio MiniRAG:

   git clone https://github.com/HKUDS/MiniRAG.git
cd MiniRAG

Instale la dependencia:

   pip install -e .

Instalación desde PyPI

MiniRAG se basa en LightRAG y, por tanto, puede instalarse directamente:

pip install lightrag-hku

Inicio rápido

Descargue el conjunto de datos necesario y colóquelo en la carpeta./datasetcatálogo. Por ejemplo, el conjunto de datos LiHua-World se ha colocado en el./dataset/LiHua-World/data/Catálogo.
Utilice el siguiente comando para indexar el conjunto de datos:

   python ./reproduce/Step_0_index.py

Ejecute el módulo de preguntas y respuestas:

   python ./reproduce/Step_1_QA.py

Como alternativa, utilice la función./main.pyEl código en inicializa el MiniRAG.

Funciones principales

Mecanismo de indexación de grafos heterogéneos

MiniRAG crea índices de grafos heterogéneos combinando bloques de texto y entidades con nombre en una estructura unificada. Los usuarios pueden conseguirlo siguiendo los pasos que se indican a continuación:

Prepare el conjunto de datos y asegúrese de que tiene el formato requerido.
Ejecute el script de indexación:

   python ./reproduce/Step_0_index.py

Una vez finalizada la indexación, los datos se almacenarán en el directorio especificado para su posterior recuperación.

Búsqueda mejorada de topología ligera

MiniRAG utiliza estructuras de grafos para el descubrimiento eficaz de conocimientos, que el usuario puede recuperar en los siguientes pasos:

Inicialice el MiniRAG:

   from minirag import MiniRAG
model = MiniRAG()

Cargar el conjunto de datos y recuperarlo:

   results = model.retrieve("你的查询")

Procesa los resultados de la búsqueda y genera una respuesta:

   response = model.generate(results)

Con los pasos anteriores, los usuarios pueden aprovechar al máximo las funciones de MiniRAG para generar mejoras de búsqueda eficientes.

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Puestos relacionados

Dippy: una herramienta interactiva para chatear con personajes de IA

Últimos recursos sobre IA # AI Juego de rol

hace 12mos

0115.9K

Volcano Writing: un editor de escritura AI fácil de usar

Últimos recursos sobre IA # AI Escritura

Hace 2 años

042.9K

Hibiki: un modelo de traducción de voz en tiempo real, traducción en flujo continuo que conserva las características de la voz original

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Traducción

Hace 1 año

058.3K

Aider: herramienta asistente de programación de código abierto, utiliza el asistente de IA para escribir código y editar archivos.

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Programación de IA

hace 11mos

070.9K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

MiniRAG: Marco de Generación Mejorada de Recuperación Simplificada, Índice de Grafos de Entidades Recupera Bloques de Texto Relevantes

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Instalación desde la fuente (recomendada)

Instalación desde PyPI

Inicio rápido

Funciones principales

Mecanismo de indexación de grafos heterogéneos

Búsqueda mejorada de topología ligera

Omni-RGPT: un gran modelo multimodal de comprensión regional de imágenes y vídeos para mejorar el análisis del contenido visual

Charla: una herramienta de chat AI minimalista basada en endpoints con integración nativa en el backend de Ollama.

Puestos relacionados

Dippy: una herramienta interactiva para chatear con personajes de IA

Volcano Writing: un editor de escritura AI fácil de usar

Hibiki: un modelo de traducción de voz en tiempo real, traducción en flujo continuo que conserva las características de la voz original

Aider: herramienta asistente de programación de código abierto, utiliza el asistente de IA para escribir código y editar archivos.

Sin comentarios

Últimas colecciones

Últimos artículos

MiniRAG: Marco de Generación Mejorada de Recuperación Simplificada, Índice de Grafos de Entidades Recupera Bloques de Texto Relevantes

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Instalación desde la fuente (recomendada)

Instalación desde PyPI

Inicio rápido

Funciones principales

Mecanismo de indexación de grafos heterogéneos

Búsqueda mejorada de topología ligera

Omni-RGPT: un gran modelo multimodal de comprensión regional de imágenes y vídeos para mejorar el análisis del contenido visual

Charla: una herramienta de chat AI minimalista basada en endpoints con integración nativa en el backend de Ollama.

Puestos relacionados

Dippy: una herramienta interactiva para chatear con personajes de IA

Volcano Writing: un editor de escritura AI fácil de usar

Hibiki: un modelo de traducción de voz en tiempo real, traducción en flujo continuo que conserva las características de la voz original

Aider: herramienta asistente de programación de código abierto, utiliza el asistente de IA para escribir código y editar archivos.

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos