OpenAIのDeep Researchツールが突如として登場した後、主要なベンダーがこぞって独自のDeep Researchツールを発表した。いわゆるディープリサーチは、通常の検索と比較され、単純なRAG検索では一般的に1ラウンドの検索しか生成されない。しかし、ディープリサーチは、人間のようにトピックに基づいて検索、分析、検索、分析を繰り返し、研究ゴールに到達することができる。この観点からは、本質的にRAGアプリケーションのアップグレード版であり、ReAct/Plan And Solveやペンダントドメインエージェントの他の構築モードの使用、記事の分解計画と生成、情報取得と分析機能を備えています。
原理的には非常にシンプルですが、完成品の独自のビジネスニーズを満たすためにプライベートを達成したい、実際のエンジニアリングの詳細だけでなく、最適化の効果は非常に複雑なので、プロジェクトや完成品の開発プラットフォームのいくつかの足場は、RAGと同じである、特に重要である、より多くのこのような開発フレームワークが表示されます。
今日、いくつかのディープリサーチのオープンソースの実装の導入に、2つの実装のアイデアに代わって、1つはLangchain Langgraphなどの既存のオーケストレーションフレームワークの実装に基づいており、もう一つは特に深層研究の開発の特性のために設計されています。それらを通じてだけでなく、迅速に深層研究のアプリケーションを構築することができますが、また、これらのフレームワークの実装の詳細を理解し、そのような検索するもの、ストレージを使用するもの、プロンプトの単語は何ですかなどの特定の選択は、リファレンスの役割の私たち自身の実装に非常に便利です。
1.Langchain Open DeepResearch
これはLangChainの公式デモ実装で ラングラフ 処理フロー全体を構築。Tavily , Perplexityなどの複数のAPIを統合することで、検索や情報収集を可能にする。ユーザーは、各章ごとに、執筆、反映、検索、リライトの反復回数を含む検索の深さを設定できるほか、レポート章の計画に対するフィードバックを行い、納得がいくまで反復することができる。
使用プロンプト:https://github.com/langchain-ai/open_deep_research/blob/main/src/open_deep_research/prompts.py
プロジェクトアドレス:https://github.com/langchain-ai/open_deep_research同类型的有Dify等框架编排的Deep 研究申請。
2.オープン・ディープ・リサーチ
Open Deep Research は、多くの配管実装の一つです。DeepSearch プロセスを分解し、自動および半自動リサーチプロセスをサポートします。様々なAPIインターフェースをサポートし、エクストラネットから情報を取得するだけでなく、要約分析のために企業内部の情報を取得することもできる。ユーザーは、Google、OpenAI、Anthropic、DeepSeekなど、ニーズに応じてさまざまなAIプラットフォームを選択することができ、パーソナライズされたリサーチを実現するためにローカルモデルにアクセスすることもできる。
ディープリサーチの3つのステップが含まれている:
- 検索結果の取得:Googleカスタム検索またはBing検索API(設定可能)を介して、指定した検索語句の包括的な検索結果を取得します。
- コンテンツ抽出:JinaAIは、情報の正確性と関連性を確保するために、選択された検索結果のコンテンツを抽出し、処理するために使用されます。
- レポート作成:ユーザーが選択したAIモデルを使用(例 ジェミニ (GPT-4、Sonnetなど)は、照合された検索結果と抽出されたコンテンツに関する詳細なレポートを生成し、ユーザー定義のプロンプトに関する詳細な分析と洞察を提供します。
以下は、レポート生成に使用されるプロンプトです:
You are a research assistant tasked with creating a comprehensive report based on multiple sources. The report should specifically address this request: "${userPrompt}" Your report should: 1. Have a clear title that reflects the specific analysis requested 2. Begin with a concise executive summary 3. Be organized into relevant sections based on the analysis requested 4. Use markdown formatting for emphasis, lists, and structure 5. Integrate information from sources naturally without explicitly referencing them by number 6. Maintain objectivity while addressing the specific aspects requested in the prompt 7. Compare and contrast the information from each source, noting areas of consensus or points of contention. 8. Showcase key insights, important data, or innovative ideas. Here are the source articles to analyze: ${articles .map( (article) => ` Title: ${article.title} URL: ${article.url} Content: ${article.content} --- ` ) .join('n')} Format the report as a JSON object with the following structure: { "title": "Report title", "summary": "Executive summary (can include markdown)", "sections": [ { "title": "Section title", "content": "Section content with markdown formatting" } ] } Use markdown formatting in the content to improve readability: - Use **bold** for emphasis - Use bullet points and numbered lists where appropriate - Use headings and subheadings with # syntax - Include code blocks if relevant - Use > for quotations - Use --- for horizontal rules where appropriate Important: Do not use phrases like "Source 1" or "According to Source 2". Instead, integrate the information naturally into the narrative or reference sources by their titles when necessary.
生成されたレポートはダウンロードしたり、ナレッジベースに保存したりすることができるが、高品質の検索ソースが不十分であり、リサーチの検証や反復プロセスが欠けているため、品質にはまだ改善の余地があるが、全体的なプロセスは明確であり、この継続的な改善と改良の基盤の上に構築するのに適している。
プロジェクトアドレス:https://github.com/btahir/open-deep-research
同じタイプもある:
https://github.com/nickscamara/open-deep-research (4.3k)
https://github.com/mshumer/OpenDeepResearcher (2.2k)
https://github.com/assafelovic/gpt-researcher (19k)
https://github.com/zaidmukaddam/scira (6.4k)
https://github.com/jina-ai/node-DeepResearch (2.6k)
その中でも、node-DeepResearchはjinaのオープンソースのディープリサーチの実装のため、直接そのapiを使用することができますし、他のモデルのインターフェイスも同様に使いやすく、すぐに自分のアプリケーションに統合することができます。
短い
冒頭で述べたように、ディープリサーチは、コンテンツへの質の高いアクセスを求めるユーザーの要求が進化した結果であり、受動的な推薦という情報の繭を壊し、従来の検索と要約を放棄し、検索と要約という非効率なプロセスを自動化によってうまく解決したものである。このような発展方向に従って、コンテンツの獲得方式は新たな変化があり、従来の検索推薦にとって大きな挑戦となる。