最高88.31 TP3T精度のSimpleQAを搭載したインテリジェントなボディ駆動型検索推論エンジン

38.6K 00

人工知能の分野では、検索エンジンの知的開発が脚光を浴びている。最近、Salaheddin Alzubi、Creston Brooks、Purva Chiniya、Edoardo Contente、Chiara von Gerlach、Lucas Irwin、Yihan Jiang、Arda Kaz、Windsor Nguyenからなるチームが発表した、Sewoong Oh、Himanshu Tyagi、Pramod Viswanathの研究者チームは、このほど、「SWF」と呼ばれる新技術を発表した。オープン・ディープ・サーチ（ODS）オープンソース検索エンジン・フレームワーククローズドソースのAI検索エンジンとオープンソースのソリューションのギャップを埋めることを目的とする。

イノベーション・コア：オープン検索ツールとオープン推論エージェント

ODSの革新的な点は、最新のオープンソースの大規模言語モデル（LLM）と推論インテリジェンスを組み合わせることで、ウェブ検索ツールを使用してユーザーのクエリに答えることを可能にすることである。このフレームワークは2つの主要なコンポーネントで構成されています：Open Search ToolとOpen Reasoning Agentです。

検索ツールを開く

オープン・サーチ・ツールは、既存のクローズド・ソースの検索エンジンを凌駕する高度なウェブ検索ツールです。このツールは、ユーザーのクエリを必要に応じて書き換えるだけでなく、検索結果から関連するコンテキストを抽出し、関連する検索結果がすべて含まれるようにチャンクして並べ替える。さらに、オープン・サーチ・ツールは、ウィキペディア、ArXiv、PubMedといった主要なウェブサイト用にカスタマイズされており、検索結果の精度と網羅性をさらに向上させている。

図1：ユーザーは、好きなベースLLMをプラグインし、オープン・ディープ・サーチ（ODS）のオープンソース・フレームワークを利用することができる。ODSは、オープン・サーチ・ツールとオープン・リーズニング・エージェントの2つのコンポーネントで構成されている。インテリジェンスは、クエリを解釈して回答するために利用可能なツールのセットを調整します。最も重要なツールはOpen Search Toolであり、ウェブ上の複数の検索ソースから高品質のコンテキストを提供する。我々の実験では、Llama3.1-70BとDeepSeek-R1をベースモデルとして使用している。

オープン推論エージェント

Open Reasoning AgentはODSのもう一つの重要なコンポーネントで、ユーザーのタスクを解釈し、様々なツールを呼び出してクエリーを完了させる役割を担っている。このインテリジェンスには、ReActベースのバージョン（ODS-v1）とCodeActベースのバージョン（ODS-v2）の2種類がある。

ODS-v1CoTはモデルに質問に答える前に考えるよう促すことで推論を強化し，ReActは推論ステップとアクション実行を組み合わせることでタスク完了と意思決定をさらに強化します．AlphaのAPIも統合されている。
図2：ODS-v1で使用されたReActプロンプト構造の概略図。
ReActフレームワークは、標準化されたインターフェイスを通じてツールの統合を可能にする：
```
Thought: [推理跟踪] Action: Tool[参数] Observation: [结果]
```
ODS-v1では、ReActインテリジェンスは3つのアクションオプションからなるプロンプトを使用します：複雑な問題分解のための「continue.think」（=continue.think）、OpenPerplexを使用して事実情報を検索するための「search」（=searchinternet）を使って事実情報を検索し、「calculate」（=calculate）を使ってWolfram Alpha APIに接続し、基本モデルでは扱いにくい数値計算を処理する。
ODS-v2ODS-v2は、より複雑なタスクを処理することができ、複数のツールとインテリジェンスの共同作業をサポートします。
図3：ODS-v2でマルチホップの質問に答えるCodeActインテリジェンス。

パフォーマンス：クローズド・ソース・ソリューションを超えて

ODSは、SimpleQAとFRAMESという2つの一般的な評価ベンチマークで優れた性能を示した。

シンプルQAODS-v1とODS-v2はそれぞれ87.71 TP3Tと88.31 TP3Tの精度を達成し、Perplexityのデフォルト検索AI（82.41 TP3T）とPerplexity Sonar Reasoning Pro（85.81 TP3T）を上回りました。OpenAIのGPT-4o Search Previewと比較すると、FRAMESではODS-v2が上回り、SimpleQAではほぼ同等である。
図4：ODS-v1は、Open Search Tool.Perplexityソナー推論プロによって取得された高品質のコンテキストを使用して複数のソースをクロスチェックすることにより、正しい答えを特定します。
図5：ODS+DeepSeek-R1は、ケイトリン・アームストロングがモリア・ウィルソンに対する殺人罪の無罪を主張し、罪状認否が行われた日として、2022年7月21日と7月20日を正しく区別した。ODSの知能は、矛盾する2つの日付をクロスチェックし、7月21日を正しく選択した。逆に、Perplexity Proは混乱し、2022年7月20日という誤った答えを出した。
フレームODS-v1+DeepSeek-R1は、単一のウェブ検索で56.71 TP3Tの精度を達成する一方、ODS-v2+DeepSeek-R1は、複数の検索で75.31 TP3Tまで精度を向上させ、利用可能な最良のベースラインを大幅に上回った。
図6：ODS-v1+Llama3.1-70Bは，Wolfram Calculatorツールを使って年齢差を正確に計算し，正しい答えを導き出した90．対照的に，Perplexityは間違った推論を行い，79歳という年齢を報告した．

オープンソース：コミュニティ・イノベーションの触媒

ODSのオープンソース実装は一般に公開されており、研究者や開発者はhttps://github.com/sentient-agi/OpenDeepSearch来获取相关代码。ODSのオープンソース実装は一般に公開されており、研究者や開発者は。

未来への展望：オープンソースが導く検索AIの新たな方向性

ODSの登場は、オープンソース検索エンジンにとって重要なマイルストーンとなる。高度な推論機能と高品質のウェブ検索ツールを組み合わせることで、ODSは性能面で既存のクローズドソースのソリューションを凌ぐだけでなく、将来の革新と発展のための基盤を築く。オープンソースコミュニティが成長を続け、技術が進歩し続ける中、ODSは検索AI分野を全く新しい時代へと導くことが期待されている。

概要

オープン・ディープ・サーチの立ち上げは、検索エンジン開発の歴史における重要なブレークスルーである。AI分野におけるオープンソース・ソリューションの大きな可能性を示すだけでなく、ユーザーや研究者に強力で柔軟なツールを提供する。より多くの開発者がこのオープンソースプロジェクトに参加することで、ODSは検索AI技術のさらなる発展を促進し、よりスマートで正確な検索体験をユーザーに提供することが期待されている。