はじめに
オープン・ディープ・リサーチは、以下のプログラムである。 一緒に AIチームによって開発され、オープンソース化された詳細なリサーチツール。人間の研究プロセスを模倣したマルチエージェントAIワークフローにより、詳細な研究レポートを作成する。ユーザーは研究トピックを入力するだけで、ツールが自動的に計画を立て、検索し、情報を評価し、引用を含むレポートを作成する。このプロジェクトはPython 3.12+をサポートしており、外部の検索サービスや言語モデリング・サービスを利用するにはAPIキーの設定が必要である。学術研究、市場分析、その他のシナリオに適しており、オープンソースとコミュニティによる拡張に重点を置いているため、誰でも無料でコードを入手し、ニーズに応じてカスタマイズすることができる。
機能一覧
- 包括的な調査の実施ユーザーが入力したトピックに基づいて、引用を含む長い調査レポートを自動的に生成します。
- 多段階の情報収集計画、検索、自己反省の段階を通じて、情報の質を確保する。
- マルチソース情報検証Tavily、HuggingFaceなどのAPIを使ったウェブ検索をサポート。
- 柔軟な建築設計ユーザーはモデル、検索ツール、レポート構造を様々なニーズに合わせてカスタマイズすることができます。
- マルチモーダル出力対応カバー画像、ポッドキャストなどの追加コンテンツは、レポート作成時に自動的に作成されます。
- オープンソースとコミュニティ主導コードは完全にオープンソースで、ユーザーは機能を変更したり拡張したりすることができます。
ヘルプの使用
設置プロセス
Open Deep Research を使用するには、ローカルまたはサーバ上で実行環境を構成する必要があります。以下に詳細なインストール手順を示します:
- 環境要件の検査
Python 3.12以降がインストールされていることを確認してください。依存関係の衝突を避けるために仮想環境を推奨します。またuv
(を少し上回るpip
(より高速で効率的なパッケージ管理ツール)。curl -LsSf https://astral.sh/uv/install.sh | sh
- クローン・コード・リポジトリ
プロジェクトのコードをGitHubからローカルにクローンする:git clone https://github.com/togethercomputer/open_deep_research.git cd open_deep_research
- 仮想環境の作成と起動
利用するuv
仮想環境を作成し、起動する:uv venv --python=3.12 source .venv/bin/activate
- 依存関係のインストール
プロジェクトに必要なすべてのPythonパッケージをインストールする:uv pip install -r pyproject.toml uv lock --check
もし ラングラフ を評価し、オプションの依存関係をインストールすることができる:
uv pip install -e ".[with-open-deep-research]"
- APIキーの設定
このプロジェクトは、検索や言語モデルの推論に、Together AI、Tavily、HuggingFaceなどの外部サービスを利用している。以下の環境変数を設定する必要があります:export TOGETHER_API_KEY=your_together_api_key export TAVILY_API_KEY=your_tavily_api_key export HUGGINGFACE_TOKEN=your_huggingface_token
そうしれいかん
your_together_api_key
などは、実際のAPIキーに置き換えられる。アカウント登録とキーの取得は、サービス・プロバイダーの公式サイトで行うことができる。 - ランニング・プロジェクト
インストールが完了したら、メインプログラムを実行して研究タスクを開始します。例えば、「人工知能の倫理」に関するレポートを作成します:python main.py --topic "人工智能伦理"
このプログラムは、プランニング、検索、レポート作成を自動的に行い、出力はMarkdownファイルとして保存される。
主な機能
Open Deep Researchの中核機能は、調査レポートの自動生成です。以下はその詳細な手順です:
- 研究テーマを入力する
ユーザーはコマンドラインまたはスクリプトで研究トピックを指定します。例python main.py --topic "气候变化的影响"
ツールが的を絞ったレポートを作成するためには、トピックはできるだけ明確でなければならない。
- 計画段階
このツールは、まず言語モデル(たとえば クロード またはGPT)を使用してレポート・アウトラインを生成します。ユーザーは、デフォルトのアウトラインを受け入れるか、カスタム構造を手動で指定するかを選択できます。例えば、カスタム構造は以下のようになります:{ "title": "气候变化影响研究", "sections": ["引言", "环境影响", "经济影响", "社会影响", "结论"] }
JSONファイルとして保存され、コマンドラインで指定される:
python main.py --topic "气候变化的影响" --structure custom_structure.json
- 情報検索と検証
ツールは タヴィリー APIは、トピックに関連するウェブコンテンツを取得するためにウェブ検索を実行する。検索を行うたびに、システムは自分自身を振り返り、情報の質を評価し、フォローアップの質問をする。例えば、検索が「気候変動による環境への影響」であった場合、システムは「海面上昇に関する特定のデータ」といったサブクエッションを生成することがある。検索結果は自動的に重複排除され、重要な情報が抽出される。 - レポート作成
このシステムは、収集した情報を、タイトル、章、導入部、本文、参考文献を含むMarkdown形式のレポートに整理します。レポートは多言語出力をサポートし、デフォルトのレポートは英語で生成されます。 - マルチモーダル・エクステンション
このツールは、レポートに添付するカバー画像とポッドキャスト音声の生成をサポートしている。画像はDALL-Eなどの画像生成モデルによって作成され、ポッドキャストは音声合成サービスによって生成されます。これらの機能には、例えば、追加のAPI設定が必要です:export DALLE_API_KEY=your_dalle_api_key
生成された画像と音声ファイルは、出力ディレクトリに保存されます。
注目の機能操作
- マルチエージェントコラボレーション
Open Deep Research は、プランニングエージェント、サーチエージェント、ライティングエージェントに分類されるマルチエージェントワークフローを使用しています。ユーザーは、設定ファイルを通してエージェントの動作を調整することができます:python main.py --topic "人工智能伦理" --max_search_depth 3
上記のコマンドは、より詳細な情報を得るために検索の反復回数を3回に増やす。
- コミュニティの拡大
このプロジェクトはオープンソースであるため、ユーザーはコード・リポジトリをフォークして新しい機能を追加することができる。例えば、新しい検索API(Googleカスタム検索など)を統合したり、より多くの言語モデルをサポートしたりできます。コードを修正した後、インストールコマンドを再実行してください。
ほら
- ネットワーク接続が安定しており、検索とモデル推論が外部APIに依存していることを確認する。
- APIキーは、漏洩を避けるために適切に保管する必要がある。
- 依存関係の衝突が発生した場合は、以下をアップグレードしてみてください。
uv
またはDockerを使ってプロジェクトを実行する。
アプリケーションシナリオ
- 学術研究
学生や研究者は、Open Deep Research を使用して、文献レビューや研究背景レポートをすばやく作成できます。例えば、「recent advances in quantum computing」と入力すると、学術データベースやウェブリソースを検索し、引用を含む詳細なレポートを作成します。 - 市場分析
ビジネスアナリストはこのツールを使って業界動向を調査することができる。例えば、「電気自動車市場予測2025」と入力すると、ツールは市場データ、ニュース、レポートを収集し、構造化された分析文書を作成します。 - 教育とトレーニング
教師はコースの教材を準備することができます。例えば、"Python Programming Basics "と入力すると、チュートリアル、サンプルコード、リソースを含むシラバスが生成されます。 - コンテンツ制作
コンテンツ制作者は、インスピレーションや背景情報に素早くアクセスできる。例えば、「メタバースの未来」と入力すると、ライティングに関する技術動向や社会的影響についてのレポートが生成される。
品質保証
- Open Deep Researchはどのような言語モデルをサポートしていますか?
Together AI、OpenAI、HuggingFace のモデルがデフォルトでサポートされています。ユーザーは、次のような設定ファイルを使って他のモデルを追加することができます。 ディープシーク あるいはクロード。 - 利用するのにお金は必要ですか?
プロジェクト自体は無料だが、依存するAPIサービス(TavilyやTogether AIなど)はキーの支払いが必要だ。ユーザーは無料の代替サービスかローカル・モデルのどちらかを選択できる。 - 報道の質はどうすれば向上するのか?
検索深度を増やす (--max_search_depth
)、またはより強力な言語モデル(GPT-4など)を使用します。被写体の詳細な説明を提供することも、より正確なレポートを生成するのに役立ちます。 - オフラインで使用できますか?
現在は、検索とモデルAPIにアクセスするためにインターネット接続が必要です。将来的には、完全にオフラインで動作するローカルモデルをサポートする可能性があります。