AIパーソナル・ラーニング
と実践的なガイダンス
豆包Marscode1

PrivateGPT: RAG処理フローを完全に局所化した文書Q&Aシステム

はじめに

PrivateGPTは、本番環境で利用可能なAIプロジェクトで、インターネットに接続することなく、Large Language Models (LLMs)を使って文書をクイズすることができます。このプロジェクトは、100%のデータプライバシーを保証し、全てのデータは、ユーザーの実行環境において、開示されることなく処理されます。PrivateGPTは、Zylonチームによって開発され、プライベートでコンテキストを意識したAIアプリケーションの構築をサポートするAPIを提供します。PrivateGPTは、ヘルスケアや法律など、高度なデータプライバシーを必要とする領域に適しています。

同様のプロジェクトKotaemon: 簡単に導入できるオープンソースのマルチモーダル文書クイズツール


PrivateGPT:使用GPT技术进行文档交互,确保数据隐私-1

 

機能一覧

  • ドキュメントの取り込み:ドキュメントの解析、分割、メタデータの抽出、埋め込み生成、保存を管理します。
  • チャット&フィニッシュ:インジェストされたドキュメントのコンテキストを使用した会話とタスクの完了。
  • 埋め込み生成:テキストに基づいて埋め込みを生成する。
  • コンテキストブロック検索:クエリの返り値に基づいて、文書内の最も関連性の高いテキストブロックを取り込む。
  • Gradio UI Client: APIをテストするための動作するクライアントを提供します。
  • バッチモデルダウンロードスクリプト、取り込みスクリプト、ドキュメントフォルダ監視などのツール。

 

ヘルプの使用

設置プロセス

  1. クローン倉庫まず、PrivateGPTのGitHubリポジトリをクローンする。
   git clone https://github.com/zylon-ai/private-gpt.git
cd private-gpt
  1. 依存関係のインストール使用pip必要なPythonの依存関係をインストールします。
   pip install -r requirements.txt
  1. 設定環境必要に応じて環境変数やセットアップファイルを設定する。
   cp settings-example.yaml settings.yaml
# 编辑settings.yaml文件,配置相关参数
  1. サービス開始Dockerを使ってサービスを開始する。
   docker-compose up -d

ドキュメントQ&A機能を使う

  1. 文書摂取処理する文書を指定したフォルダに入れ、取り込みスクリプトを実行します。
   python scripts/ingest.py --input-folder path/to/documents
  1. Q&A インタラクションQ&A には Gradio UI クライアントを使用します。
   python app.py
# 打开浏览器访问http://localhost:7860

ハイレベルAPIの使用法

  1. ドキュメントの解析と埋め込み生成高水準APIを使った文書解析と埋め込み生成。
   from private_gpt import HighLevelAPI
api = HighLevelAPI()
api.ingest_documents("path/to/documents")
  1. コンテキスト検索と回答生成高レベルAPIを使用したコンテキスト検索と回答生成。
   response = api.chat("你的问题")
print(response)

低レベルAPIの使用法

  1. エンベディング・ジェネレーション低レベルAPIを使用してテキスト埋め込みを生成します。
   from private_gpt import LowLevelAPI
api = LowLevelAPI()
embedding = api.generate_embedding("你的文本")
  1. コンテキストブロック検索低レベルAPIを使用したコンテキストブロック検索。
   chunks = api.retrieve_chunks("你的查询")
print(chunks)

ツールセットの使い方

  1. バッチモデルダウンロード一括モデルダウンロードスクリプトを使用して、必要なモデルをダウンロードします。
   python scripts/download_models.py
  1. ドキュメントフォルダの監視ドキュメントフォルダモニタツールを使用して、新しいドキュメントを自動的に取り込みます。
   python scripts/watch_folder.py --folder path/to/documents
無断転載を禁じます:チーフAIシェアリングサークル " PrivateGPT: RAG処理フローを完全に局所化した文書Q&Aシステム
ja日本語