AIパーソナル・ラーニング
と実践的なガイダンス

MiniRAG:簡易検索拡張生成フレームワーク、エンティティグラフインデックスリコール関連テキストブロック

この記事は2025-01-19 14:53に更新されました。内容の一部は一刻を争うものですので、無効な場合はメッセージを残してください!

はじめに

MiniRAGは、極めてシンプルなRAG(Retrieval Augmented Generation)フレームワークであり、異種グラフインデックスと軽量トポロジー拡張検索により、小さなモデルでも優れたRAG性能を達成することを目的としている。香港大学(HKUDS)のデータサイエンス研究所によって開発されたこのプロジェクトは、既存のRAGフレームワークにおいて小規模言語モデル(SLM)が直面する性能低下の問題を解決することに焦点を当てている。miniRAGは、テキストチャンクと名前付きエンティティを単一の統一された構造に結合することで、複雑な意味理解への依存を減らし、効率的な知識発見のためにグラフ構造を利用する。このフレームワークは、大規模言語モデル(LLM)アプローチの25%の記憶領域だけで同等の性能を達成する。

MiniRAG: 知識グラフを埋め込んだ関連テキストブロックによる簡易検索強化生成フレームワーク-1


 

機能一覧

  • 異種グラフインデックス作成メカニズム:テキストブロックと名前付き実体を組み合わせることで、複雑な意味理解への依存を減らす。
  • 軽量トポロジー拡張検索:グラフ構造を利用した効率的な知識発見。
  • 小さな言語モデルとの互換性:リソースに制約のあるシナリオで効率的なRAGパフォーマンスを提供。
  • 包括的なベンチマークデータセット:LiHua-Worldデータセットは、複雑なクエリに対する軽量RAGシステムの性能を評価するために提供される。
  • 簡単なインストール:ソースコードやPyPIからのインストールをサポートしています。

 

ヘルプの使用

設置プロセス

ソースからのインストール(推奨)

  1. MiniRAGリポジトリのクローニング:
   git clone https://github.com/HKUDS/MiniRAG.git
cd MiniRAG
  1. 依存関係をインストールします:
   pip install -e .

PyPIからのインストール

MiniRAGはLightRAGをベースにしているため、直接インストールできる:

pip install lightrag-hku

クイックスタート

  1. 必要なデータセットをダウンロードして./データセットカタログに掲載されている。たとえば、LiHua-World データセットは./dataset/LiHua-World/data/カタログ
  2. データセットのインデックスを作成するには、以下のコマンドを使用する:
   python ./reproduce/Step_0_index.py
  1. Q&Aモジュールを実行する:
   python ./reproduce/Step_1_QA.py
  1. または./main.pyのコードは MiniRAG を初期化します。

主な機能

異種グラフ索引付けメカニズム

MiniRAGは、テキストブロックと名前付きエンティティを統一構造で結合することにより、異種グラフインデックスを作成する。ユーザーは以下の手順でこれを実現できる:

  1. データセットを準備し、データセットが必要に応じてフォーマットされていることを確認する。
  2. インデックス作成スクリプトを実行する:
   python ./reproduce/Step_0_index.py
  1. インデックス作成が完了すると、データは指定されたディレクトリに保存され、以後の検索が可能になる。

軽量トポロジー拡張サーチ

MiniRAGは効率的な知識発見のためにグラフ構造を利用し、以下のステップでユーザが検索できる:

  1. MiniRAG を初期化します:
   from minirag import MiniRAG
モデル = MiniRAG()
  1. データセットをロードして取り出す:
   results = model.retrieve("あなたのクエリ")
  1. 検索結果を処理し、応答を生成する:
   response = model.generate(結果)

以上の手順で、ユーザーはMiniRAGの機能をフルに活用し、効率的な検索機能拡張生成を行うことができる。

無断転載を禁じます:チーフAIシェアリングサークル " MiniRAG:簡易検索拡張生成フレームワーク、エンティティグラフインデックスリコール関連テキストブロック

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語