MiniRAG: 간소화된 검색 강화 생성 프레임워크, 엔티티 그래프 인덱스 관련 텍스트 블록 리콜

59.1K 00

일반 소개

MiniRAG는 이기종 그래프 인덱싱과 경량 토폴로지 강화 검색을 통해 작은 모델에서도 우수한 RAG 성능을 달성하는 것을 목표로 하는 매우 간단한 검색 증강 생성(RAG) 프레임워크입니다. 홍콩대학교 데이터 과학 연구소(HKUDS)에서 개발한 이 프로젝트는 기존 RAG 프레임워크에서 소규모 언어 모델(SLM)이 직면한 성능 저하 문제를 해결하는 데 중점을 두고 있습니다. miniRAG는 텍스트 청크와 명명된 엔터티를 하나의 통합된 구조로 결합하여 복잡한 의미 이해에 대한 의존도를 줄이고 효율적인 지식 검색을 위해 그래프 구조를 활용합니다. 이 프레임워크는 대규모 언어 모델(LLM) 접근 방식의 251 TP3T의 저장 공간만으로 비슷한 성능을 달성합니다.

기능 목록

이기종 그래프 인덱싱 메커니즘: 텍스트 블록과 명명된 엔티티를 결합하여 복잡한 의미 이해에 대한 의존도를 줄입니다.
경량 토폴로지 강화 검색: 그래프 구조를 사용해 효율적으로 지식을 검색합니다.
소규모 언어 모델과 호환: 리소스가 제한된 시나리오에서 효율적인 RAG 성능을 제공합니다.
포괄적인 벤치마크 데이터 세트: 복잡한 쿼리에서 경량 RAG 시스템의 성능을 평가하기 위해 LiHua-World 데이터 세트가 제공됩니다.
간편한 설치: 소스 코드 및 PyPI를 통한 설치를 지원합니다.

도움말 사용

설치 프로세스

소스에서 설치(권장)

MiniRAG 리포지토리 복제하기:

   git clone https://github.com/HKUDS/MiniRAG.git
cd MiniRAG

종속성을 설치합니다:

   pip install -e .

PyPI에서 설치

미니랙은 라이트랙을 기반으로 하므로 직접 설치할 수 있습니다:

pip install lightrag-hku

빠른 시작

필요한 데이터 세트를 다운로드하여 다음 위치에 놓습니다../dataset카탈로그로 이동합니다. 예를 들어, LiHua-World 데이터 세트는./dataset/LiHua-World/data/카탈로그.
다음 명령을 사용하여 데이터 집합을 색인합니다:

   python ./reproduce/Step_0_index.py

Q&A 모듈을 실행합니다:

   python ./reproduce/Step_1_QA.py

또는./main.py의 코드는 미니랙을 초기화합니다.

주요 기능

이기종 그래프 인덱싱 메커니즘

MiniRAG는 텍스트 블록과 명명된 엔티티를 통합된 구조로 결합하여 이기종 그래프 인덱스를 생성합니다. 사용자는 아래 단계에 따라 이를 수행할 수 있습니다:

데이터 집합을 준비하고 필요에 따라 데이터 집합의 형식이 지정되었는지 확인합니다.
인덱싱 스크립트를 실행합니다:

   python ./reproduce/Step_0_index.py

인덱싱이 완료되면 데이터는 나중에 검색할 수 있도록 지정된 디렉터리에 저장됩니다.

경량 토폴로지 향상된 검색

미니래그는 효율적인 지식 검색을 위해 그래프 구조를 활용하며, 사용자는 다음 단계에 따라 이를 검색할 수 있습니다:

미니랙을 초기화합니다:

   from minirag import MiniRAG
model = MiniRAG()

데이터 집합을 로드하고 검색합니다:

   results = model.retrieve("你的查询")

검색 결과를 처리하고 응답을 생성합니다:

   response = model.generate(results)

위의 단계를 통해 사용자는 효율적인 검색 향상 생성을 위해 MiniRAG의 기능을 최대한 활용할 수 있습니다.

Skyvern: LLM 및 컴퓨터 비전으로 브라우저 기반 워크플로 자동화하기

1 년 전

0103.4K

Pal Chat: 여러 AI 모델을 지원하는 IOS 채팅 클라이언트

최신 AI 리소스 # AI 현지화 채팅 애플리케이션

1 년 전

065.6K

Avcado AI: 식품 라벨을 스캔하고 성분을 분석하는 건강 도우미

최신 AI 리소스 # AI 생활 효율 도우미

11개월 전

052K

Mochii AI: 여러 모델에 무료로 액세스할 수 있는 다목적 AI 비서

최신 AI 리소스 # AI 통합 다중 모델 대화 플랫폼

1 년 전

053.5K

댓글 없음

댓글에 참여하려면 로그인해야 합니다!

지금 로그인

댓글 없음...

MiniRAG: 간소화된 검색 강화 생성 프레임워크, 엔티티 그래프 인덱스 관련 텍스트 블록 리콜

일반 소개

기능 목록

도움말 사용

설치 프로세스

소스에서 설치(권장)

PyPI에서 설치

빠른 시작

주요 기능

이기종 그래프 인덱싱 메커니즘

경량 토폴로지 향상된 검색

Omni-RGPT: 시각 콘텐츠 분석을 개선하기 위한 이미지 및 비디오 영역 수준 이해를 위한 멀티모달 그랜드 모델

Charla: Ollama 백엔드에 기본적으로 통합되는 미니멀한 엔드포인트 기반 AI 채팅 도구

관련 문서

Skyvern: LLM 및 컴퓨터 비전으로 브라우저 기반 워크플로 자동화하기

Pal Chat: 여러 AI 모델을 지원하는 IOS 채팅 클라이언트

Avcado AI: 식품 라벨을 스캔하고 성분을 분석하는 건강 도우미

Mochii AI: 여러 모델에 무료로 액세스할 수 있는 다목적 AI 비서

댓글 없음

최신 컬렉션

최신 기사

MiniRAG: 간소화된 검색 강화 생성 프레임워크, 엔티티 그래프 인덱스 관련 텍스트 블록 리콜

일반 소개

기능 목록

도움말 사용

설치 프로세스

소스에서 설치(권장)

PyPI에서 설치

빠른 시작

주요 기능

이기종 그래프 인덱싱 메커니즘

경량 토폴로지 향상된 검색

Omni-RGPT: 시각 콘텐츠 분석을 개선하기 위한 이미지 및 비디오 영역 수준 이해를 위한 멀티모달 그랜드 모델

Charla: Ollama 백엔드에 기본적으로 통합되는 미니멀한 엔드포인트 기반 AI 채팅 도구

관련 문서

Skyvern: LLM 및 컴퓨터 비전으로 브라우저 기반 워크플로 자동화하기

Pal Chat: 여러 AI 모델을 지원하는 IOS 채팅 클라이언트

Avcado AI: 식품 라벨을 스캔하고 성분을 분석하는 건강 도우미

Mochii AI: 여러 모델에 무료로 액세스할 수 있는 다목적 AI 비서

댓글 없음

선택한 AI 도구

최신 컬렉션

최신 기사