はじめに
CHRONOSはAlibaba NLPチームによって開発されたニュースタイムライン要約ツールです。CHRONOSはオープンドメインのタイムライン要約タスクを処理できるだけでなく、効率性とスケーラビリティも大幅に向上している。そのユニークなデータセットとアルゴリズムにより、研究者とニュースの実務者の両方にとって、ニュースの検索とタイムラインの生成において優れた性能を発揮する。
機能一覧
- ニュース・タイムライン・ジェネレーション自問自答を繰り返しながら、ニュースの年表を作成する。
- オープンドメインのタイムラインの概要幅広いデータセットをカバーするオープンな領域で、タイムラインの要約タスクを処理する。
- 効率的なニュース検索高度な検索アルゴリズムにより、関連ニュースを素早く見つけることができます。
- データセットのリリース研究用にオープンフィールドのタイムラインにまとめたデータセットを提供する。
- API統合Qwen、GPTなどのモデルとのAPI統合をサポートし、機能を強化。
ヘルプの使用
設置プロセス
- 依存関係のインストールまず、必要なPython依存パッケージがインストールされていることを確認してください。コマンドラインから以下のコマンドを実行する:
pip install -r requirements.txt
- サンプル問題の作成データセット用のトピック例題のプールを構築します。次のコマンドを実行してください:
python question_exampler.py
または、提供されたdata/question_examples.json
ファイルには、Crisis、T17、Open-TLSデータセットのサンプル問題が含まれています。
- ランニング・クロノス次のコマンドを実行して、Open Field Timeline Summaryタスクを完了する:
python main.py --model_name "モデル名" --max_round "最大反復ラウンド数" --dataset open --output "出力ディレクトリ" --question_exs
使用ガイドライン
- APIキーの交換を実行する前に
src/model.py
APIキーのプレースホルダーを、QwenまたはGPTモデルを呼び出すためのAPIキーに置き換えてください:
DASHSCOPE_API_KEY = "あなたのAPIキー"
OPENAI_API_KEY = "あなたのAPIキー"
同時にsrc/searcher.py
をBingウェブ検索APIキーに入力してください:
BING_SEARCH_KEY = "あなたのAPIキー"
CHRONOSにスニペットだけでなく、全ページを使わせたい場合は、以下をsrc/reader.py
をJINAキーに設定してください:
JINA_API_KEY = "あなたのAPIキー"
- スクリプトの実行次のコマンドでCHRONOSを実行し、Open Domain Timeline Summaryデータセットを使って実験します:
python main.py --model_name "モデル名" --max_round "最大反復ラウンド数" --dataset open --output "出力ディレクトリ" --question_exs
機能 操作の流れ
- ニュース・タイムライン・ジェネレーションCHRONOSは、反復的な自己質問によって、ニュースの詳細なタイムラインを生成することができます。ユーザーは必要に応じて反復の回数を調整し、より包括的なニュースの要約を得ることができます。
- オープンドメインのタイムラインの概要CHRONOSは様々なオープンドメインのTimeline要約タスクを処理できるデータセットを幅広くカバーしている。ユーザーは提供されたデータセットやカスタマイズされたデータセットを使って実験することができる。
- 効率的なニュース検索CHRONOSは高度な検索アルゴリズムにより、関連するニュースを素早く見つけることができます。ユーザーはAPI統合によって検索機能を強化し、効率を向上させることができます。
- データセットのリリース: CHRONOSは、研究者が利用できるように、オープンドメインのタイムラインサマリーのデータセットを提供する。ユーザーはこれらのデータセットをダウンロードして、さらなる研究に利用することができます。
- API統合CHRONOSは、Qwen、GPTなどのモデルとのAPI統合をサポートしています。ユーザーは必要に応じて適切なモデルを選択し、機能を強化することができます。
以上の手順で、ユーザーは簡単にCHRONOSをインストールし、ニュースのタイムライン要約を生成するために使用することができ、ニュースの検索とタイムライン生成の効率を向上させることができます。