AIパーソナル・ラーニング
と実践的なガイダンス

Denser Chat: PDFファイルとのインタラクト、ソースコードハイライトの提供

はじめに

Denser Chatはdenser.aiによって開発・保守されているチャットボット・プロジェクトで、PDFファイルやウェブページからテキストや表を抽出し、ソースコードハイライトを行います。このプロジェクトは、denser-retrieverベースのチャットボットの構築をサポートし、インタラクティブなStreamlitチャットボット・アプリケーションを提供します。ユーザーは、簡単なインストールと設定で、PDFやウェブ・コンテンツに関連する質問に答えるチャットボットを素早くデプロイし、使用することができます。

Denser Chat: PDFファイルとの対話、ソースコードのハイライト-1


 

機能一覧

  • PDFファイルやウェブページからテキストや表を抽出
  • denser-retrieverをベースにしたチャットボットの構築
  • インタラクティブなStreamlitチャットボットアプリケーションのサポート
  • ソースコードハイライト機能の提供
  • データソースとして複数のファイル形式とURLをサポート
  • Docker ComposeでElasticsearchとMilvusのサービスを開始する
  • OpenAIまたは クロード チャット機能を提供するAPI

 

ヘルプの使用

設置プロセス

  1. クローン倉庫
   git clone https://github.com/denser-org/denser-chat.git
  1. プロジェクト・ディレクトリに移動し、仮想環境を起動する(Pythonのバージョンが3.11であることを確認する):
   cd denser-chat
python -m venv .venv
ソース .venv/bin/activate
  1. 必要なパッケージをインストールする:
   pip install -e .

あるいはポエトリーを使う:

   ポエトリー・インストール

クイックスタート

  1. インデックスを構築する前に、Docker Composeを実行してElasticsearchとMilvusのサービスを起動します:
   cd denser_chat
docker compose up -d
  1. チャットボット・インデックスの構築
   python build.py sources.txt output test_index

ここで、最初のパラメータはチャットボットを構築するために使用されるファイルで、ローカルのPDFファイル、URLのPDF、またはURLであることができます。2番目のパラメータは出力ディレクトリで、3番目のパラメータはインデックス名です。

  1. PDF サービ ス を提供す る ために ロ ーカルサーバーを起動:
   python -m http.server 8000
  1. Streamlitアプリケーションを起動する:
   cd denser_chat
streamlit run demo.py -- --インデックス名 test_index

使用機能

  • テキストと表の抽出PDFファイルをアップロードするか、ウェブ・ページのURLを入力すると、Denser Chatが自動的にテキストとテーブル・コンテンツを抽出します。
  • ソースコードのハイライトチャット中、Denser ChatはPDFファイル内の関連するソースコードをハイライトし、見やすく理解しやすくします。
  • インタラクティブ・チャットOpenAIやクロードAPIキーを設定することで、ユーザーはチャットボットと対話し、正確な回答を得ることができる。

詳しい操作手順

  1. ファイルのアップロードアプリケーションのインターフェイスでPDFファイルを選択してアップロードするか、ウェブページのURLを入力します。
  2. 質問をする例えば、「バッチ内のネガティブサンプリングとは何ですか?どの部品にストップピンが付いていますか?.
  3. 結果を見るDenser Chatは、回答をハイライトして返すので、ユーザーは関連するコンテンツをすぐに見つけることができます。
AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " Denser Chat: PDFファイルとのインタラクト、ソースコードハイライトの提供

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語