知識テーブル：構造化データの効率的な抽出と探索のためのオープンソースツール

59.9K 00

はじめに

Knowledge Tableは、非構造化ドキュメントから構造化データを抽出し、探索するプロセスを簡素化するために設計されたオープンソースプロジェクトです。ユーザーは、自然言語クエリーインターフェースを介して、表やグラフなどの構造化された知識表現を作成することができます。このツールは、カスタム抽出ルールとフォーマットオプションをサポートし、ユーザーインターフェイスを通じてデータソースを表示することで、データのトレーサビリティを確保します。Knowledge Sheetsは、ビジネスユーザーに使い慣れたスプレッドシート・インターフェースを提供する一方、開発者にはさまざまなデータ処理ニーズに対応する柔軟で高度に設定可能なバックエンドを提供します。

機能一覧

自然言語抽出（NLE）自然言語クエリを使用した非構造化ドキュメントからの構造化データ抽出をサポート。
カスタム抽出ルールユーザーは抽出ルールを定義し、データの品質を確保することができます。
フォーマット制御抽出されたデータの出力形式を制御することができます。
ドキュメント・フィルタリングメタデータや抽出データに基づいて文書をフィルタリングします。
CSVまたはマップトライアドのエクスポート抽出したデータをCSVやタプル形式でダウンロード可能。
チェーン抽出質問で過去のコラムを参照できるようにする。

ヘルプの使用

インストールと操作

Dockerの実行::
- DockerとDocker Composeがインストールされていることを確認する。
- コマンドの使用 docker-compose up -d --build アプリケーションを起動する。
- フロントエンドへのアクセス http://localhost:3000 バックエンド http://localhost:8000.
ローカルオペレーション::
- コードベースのクローン：git clone https://github.com/yourusername/knowledge-table.git
- バックエンドディレクトリに移動し、仮想環境を作成する：
```
cd knowledge-table/backend/
python3 -m venv venv
source venv/bin/activate  # Windows使用 venv\Scripts\activate
pip install -r requirements.txt
```
- バックエンド・サービスを開始する：
```
cd src/
python -m uvicorn knowledge_table_api.main:app
```
フロントエンドの設定::
- フロントエンドのディレクトリに移動し、依存関係をインストールします：
```
cd ../frontend/
curl https://bun.sh/install | bash  # 安装Bun
bun install
bun start
```
- フロントエンドのサービスは http://localhost:5173 アクセス