PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

57.8K 00

はじめに

PRAG (Parametric Retrieval-Augmented Generation)は、大規模言語モデル(Large Language Model: LLM)のパラメータ空間に外部知識を直接埋め込むことにより、生成機能を強化するように設計された革新的な検索拡張生成ツールである。PRAGは、データ拡張モジュール、パラメータ学習モジュール、様々なクイズデータセットの性能テスト用の推論モジュールを含む、エンドツーエンドの実装を提供する。

機能一覧

データ強化モジュールドキュメントをデータ化。
パラメーター・トレーニング・モジュールLoRAの追加パラメータを訓練して、文書のパラメータ化された表現を生成する。
推論モジュール関連文書のパラメータ化された表現をマージし、推論のためにLLMに挿入する。
環境インストール詳細な環境インストール手順と依存関係を提供します。
自己啓発エンハンス済みデータファイルの直接使用、または自己処理によるデータエンハンスに対応。
検索準備ウィキペディアのデータセットをダウンロードし、検索の準備をします。

ヘルプの使用

環境インストール

仮想環境を作成し、起動する：

   conda create -n prag python=3.10.4
conda activate prag

必要な依存関係をインストールする：

   pip install torch==2.1.0
pip install -r requirements.txt

修正 src/root_dir_path.py 正鵠を得る ROOT_DIR 変数は、PRAGが保存されているフォルダのアドレスである。

データ強化

事前にエンハンスされたデータファイルを使用する：

   tar -xzvf data_aug.tar.gz

自己処理によるデータ強化：
- ウィキペディアのデータセットをダウンロードする： bash mkdir -p data/dpr wget -O data/dpr/psgs_w100.tsv.gz https://dl.fbaipublicfiles.com/dpr/wikipedia_split/psgs_w100.tsv.gz
- 意図する BM25 取得した： bash # 具体步骤请参考项目文档

パラメトリックトレーニング

文書のパラメータ化された表現を生成する：

   # 具体步骤请参考项目文档

推論

関連文書のパラメータ化された表現がマージされ、推論のためにLLMに挿入される：

   # 具体步骤请参考项目文档

Meiman：オンラインソフトファニッシング（家庭用家具）デザインツール、デザインソリューションの迅速な生成、ソフトファニッシング補助AIツールキット

9ヶ月前

037.6K

Raycast-G4F：通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます！

1年前

060.6K

OmniThink：生成高质量长文的写作框架，搜索外部知识后反思并逐步构建知识树

OmniThink：質の高い長文エッセイを作成するためのライティング・フレームワークで、外部の知識を検索し、それを振り返り、段階的に知識ツリーを構築する。

1年前

049.8K

ボットナウ：スマートマーケティングとスマートオフィスのためのAIインテリジェントボディ作成・配信プラットフォーム

最新のAIリソース #インテリジェント・ボディ・アプリケーション

1年前

049.9K

コメントなし

コメントに参加するにはログインが必要です！

今すぐログイン

コメントはありません

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

はじめに

機能一覧

ヘルプの使用

環境インストール

データ強化

パラメトリックトレーニング

推論

GPTリサーチャー：ローカルおよびウェブベースのデータを使用して、包括的で詳細な調査レポートを作成します。

ロウフィル：文書からの構造化情報の一括抽出と自動分析

関連記事

Meiman：オンラインソフトファニッシング（家庭用家具）デザインツール、デザインソリューションの迅速な生成、ソフトファニッシング補助AIツールキット

Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます！

OmniThink：質の高い長文エッセイを作成するためのライティング・フレームワークで、外部の知識を検索し、それを振り返り、段階的に知識ツリーを構築する。

ボットナウ：スマートマーケティングとスマートオフィスのためのAIインテリジェントボディ作成・配信プラットフォーム

コメントなし

最新コレクション

最新記事

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

はじめに

機能一覧

ヘルプの使用

環境インストール

データ強化

パラメトリックトレーニング

推論

GPTリサーチャー：ローカルおよびウェブベースのデータを使用して、包括的で詳細な調査レポートを作成します。

ロウフィル：文書からの構造化情報の一括抽出と自動分析

関連記事

Meiman：オンラインソフトファニッシング（家庭用家具）デザインツール、デザインソリューションの迅速な生成、ソフトファニッシング補助AIツールキット

Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます！

OmniThink：質の高い長文エッセイを作成するためのライティング・フレームワークで、外部の知識を検索し、それを振り返り、段階的に知識ツリーを構築する。

ボットナウ：スマートマーケティングとスマートオフィスのためのAIインテリジェントボディ作成・配信プラットフォーム

コメントなし

厳選されたAIツール

最新コレクション

最新記事