膨大な情報を検索しても、必要な答えが見つからないことにうんざりしていませんか?プロのアナリストのように綿密なリサーチをしてくれる知的アシスタントに憧れませんか?OpenAIは、最新かつ最も革新的なソフトウェア、OpenAIの発売を発表できることを誇りに思います。 チャットGPT の全く新しい機能である。ディープ・リサーチ!それは、情報の入手方法を完全に変え、従来なら何時間もかかっていた複雑な調査作業を、わずか数分で完了させることを可能にする。この記事では、綿密な調査の強力な機能、応用シナリオ、作業原理、そして今後の開発の方向性について深く理解し、AIが知識労働にどのような力を与え、知的調査の新時代を切り開くかを一緒に目撃していきましょう!
これは、推論を駆使して大量のオンライン情報を総合し、あなたに代わって複数ステップの調査タスクを実行するインテリジェンスで、次のようなものに似ている。 当惑 歌で応える ジェミニ OpenAIが新たにリリースした「Deep Research」は、その強力なo3モデルを使ってウェブ検索による大量の情報を照合・分析し、最終的に引用文献を含む詳細な専門レポートを生成する。この機能は発売以来広く注目を集めており、「超強力な」AIアシスタントとして、AI支援研究の新時代の到来を告げるものとして歓迎されている。
Proユーザーには本日から提供され、PlusとTeamユーザーには次に提供される予定だ。
一言で言えば"ディープリサーチ "は、多段階のネットワーク調査を自律的に実施し、人間の研究者であれば通常数時間かかる複雑な調査タスクを5~30分で完了させ、その結果を高品質なレポートとしてユーザーに提示する。
参考図書グーグル、ディープリサーチを開始そしてオープン・ディープ・リサーチ:ウェブ検索コンテンツに基づくAI研究の生成そしてSTORM:トピックに基づくウェブデータの検索、引用文献を含む論文の生成、長い論文レポート
"ディープリサーチ "の実力は?探ってみよう:
- パワフルで信じられないほど効率的: 徹夜で情報を探し続けることに別れを告げましょう!「ディープリサーチ」は、従来は何時間もかかっていた複雑な研究を5~30分で完了させ、専門家レベルの分析を提供するために必要なだけ深く掘り下げる能力によって、研究をまったく新しいレベルの効率へと導きます。
- 結果は信頼できるものであり、十分に文書化されている: もう情報の出典を心配する必要はありません!すべての結論には、元のウェブページやPDFの関連する段落に至るまで詳細な引用が付されているため、ユーザーは情報の正確性を簡単に追跡・確認することができ、あなたの研究をより説得力のあるものにすることができます。
- 適用範囲が広く、柔軟で使いやすい: 競合分析、市場調査、製品ショッピング、学術調査など、「ディープリサーチ」はあなたの右腕となります。ChatGPTのインターフェースから "ディープリサーチ "を選択し、クエリを入力するだけでリサーチが開始できます。より具体的なコンテキストを提供するためにファイル(PDFなど)のアップロードをサポートし、サイドバーに研究の進捗状況や引用ソースをリアルタイムで表示します。
- 技術的に高度で、優れたパフォーマンス: エンドツーエンドの強化学習に基づいて、ディープリサーチは、マルチステップのブラウジングと推論タスクを実行することができます。ウェブサイトコンテンツの読み取り、データ処理、図表の生成、議論をサポートするためのソーステキストの引用をサポートしています。人類最後の試験」(HLE)と呼ばれる難しいベンチマークテストにおいて、Deep Researchは26.6%のスコアを達成し、以下を含む先行製品のスコアを大きく上回った。 o3-ミニ (13%)とo1(9%)で、その強力な情報検索・統合能力と人間に近い研究行動が実証された。
- 緩やかな自由化と有望な未来: 現在、Proユーザー(月間100検索)に提供されており、1ヶ月以内にPlusユーザー(月間10検索)に拡張され、TeamおよびEnterpriseエディションがそれに続く予定である。また、将来的にはモバイル/デスクトップ・アプリケーションにも対応し、より強力なパーソナライゼーションのために、より多くのデータ・ソース(サブスクリプションと社内の両方)に接続する予定です。
これらのディテールも同様に注目に値する:
- より多くのツールを呼べば呼ぶほど、精度が上がる: グラフは、ツールコールの回数(Max Tool Calls)が増加するにつれて、HLEテストにおけるディープリサーチの合格率が上昇していることを示しており、ディープリサーチのインテリジェンスとツール活用能力の間に正の相関関係があることを示している。
- 幻覚の問題はまだ改善する必要がある: ディープリサーチの印象的なパフォーマンスにもかかわらず、錯覚や誤った推論の可能性が残っており、これはOpenAIのその後の最適化の重要な焦点となっている。
- オペレーターと組み合わせることで、可能性は無限に広がる: OpenAIの将来の計画は、深いオンライン・リサーチと実世界のオペレーションを組み合わせることだ(オペレーター)を組み合わせることで、より強力なインテリジェント・ボディ機能を実現することが期待されている!
DeepResearch公式レビュー全文
今日、私たちはChatGPTでディープリサーチを開始します。これは、複雑なタスクのためにインターネット上でマルチステップリサーチを可能にする新しいエージェント機能です。人間が数時間かかる作業を数十分で行うことができます。
ディープリサーチは、オープンエイの次世代インテリジェンスで、自分で作業することができます。プロンプトを与えると、ChatGPTが何百ものオンラインソースを検索、分析、合成し、リサーチアナリストレベルの包括的なレポートを作成します。ウェブブラウジングとデータ分析に最適化されたOpenAI o3モデルの次期バージョンを搭載しており、推論を使用してインターネット上の膨大な量のテキスト、画像、PDFを検索、解釈、分析し、遭遇した情報に基づいて必要な調整を行います。
知識を合成する能力は、新しい知識を創造するための前提条件である。このため、ディープリサーチは、AGIを開発するという私たちのより広い目標に向けた重要な一歩となります。
綿密な調査を行う理由
ディープリサーチは、金融、科学、政策、工学などの分野で知識集約的な仕事をし、徹底的で正確かつ信頼性の高い調査を必要とする人々のために構築されています。また、自動車、家電製品、家具など、通常であれば入念なリサーチが必要な購入品について、超パーソナライズされたアドバイスを求める買い物上手にも役立ちます。各アウトプットは、明確な引用と考察の要約によって完全に文書化されているため、情報の参照や検証が容易である。多数のサイトを閲覧する必要がある、ニッチで直感的でない情報を見つけるのに特に効果的です。ディープリサーチは、複雑で時間のかかるウェブリサーチを1つのクエリでオフロードし、スピードアップすることで、貴重な時間を解放します。
ディープリサーチは、ウェブ全体からの洞察を独自に発見し、推論し、統合します。これを達成するために、OpenAI o1(私たちの最初の推論モデル)と同じ強化学習アプローチを使用しており、ブラウザとPythonツールの使用を必要とする実世界のタスクで訓練されています。o1はコーディング、数学、その他の技術分野で素晴らしい能力を発揮しますが、多くの実世界の課題は、広範な背景と多様なオンラインソースからの情報収集を必要とします。綿密な研究は、このギャップを埋め、人々が仕事や日常生活で直面する幅広い問題に取り組むことを可能にするために、これらの推論能力を構築する。
綿密な調査の方法
ChatGPTでは、メッセージエディタで「ディープリサーチ」を選択し、クエリを入力します。ストリーミングプラットフォームの競合分析でも、最適な通勤用自転車のパーソナライズレポートでも、必要なものをChatGPTに伝えてください。ファイルやスプレッドシートを添付して、質問にコンテキストを追加することもできます。一度実行すると、サイドバーに実行したステップと使用したソースの概要が表示されます。
詳細な調査には5分から30分かかることがあり、ネットワークを深く掘り下げる時間が必要です。その間、あなたはその場を離れたり、他の仕事に取り組んだりすることができます - 調査が完了すると通知されます。最終的なアウトプットは、チャットのレポートという形で提供されます。今後数週間のうちに、これらのレポートに埋め込み画像、データの視覚化、その他の分析アウトプットを追加し、さらなる明確さとコンテキストを提供する予定です。
ディープリサーチとは対照的に、GPT-4oはリアルタイムのマルチモーダル対話に適している。そのため深さと詳細さが重要な、多面的で領域固有の分野クエリー、広範な探求のための綿密なリサーチ、そして各記述を引用する能力は、迅速な要約と、(仕事上の成果物として使用できる)十分に文書化され検証された回答との違いである。
この綿密な調査は、プロンプトに対して非常に詳細に回答し、先進国上位10カ国と発展途上国上位10カ国の国別/地域別データを並べて提供することで、参照と比較を容易にします。この情報をもとに、詳細かつ十分な情報に基づいた実践的な市場参入に関する推奨事項を提供しています。公式例を見る: https://openai.com/index/introducing-deep-research/
動作原理
ディープリサーチは、様々なドメインにおける困難なブラウジングや推論タスクに対して、エンドツーエンドの強化学習を用いてトレーニングされる。このトレーニングを通じて、必要なデータを見つけるために多段階の軌跡を計画し実行することや、必要に応じてバックトラックしてリアルタイムの情報に反応することを学習した。このモデルはまた、ユーザーによってアップロードされたファイルをブラウズし、パイソンツールを使ってグラフィックを描き、反復し、ウェブサイトから生成されたグラフィックや画像を回答に埋め込み、ソースから特定の文章や段落を引用することができる。このようなトレーニングの結果、実世界の問題に焦点を当てた多くの公開評価で、このモデルは新たな高みに到達した。
人類最後の試験
ある 人類最後の試験(新しいウインドウで開きます)(最近リリースされた、幅広いトピックについて専門家レベルの質問で AI をテストするアセスメント)で、Deep Research 対応モデルは 26.6% の精度で過去最高を記録しました。このテストには、言語学からロケット科学、古典から生態学まで、100以上のトピックをカバーする3,000以上の多肢選択式および記述式の問題が含まれています。OpenAI o1と比較して最も向上したのは、化学、人文・社会科学、数学でした。深い研究をサポートするモデルは、必要に応じて専門的な情報を効果的に探し出す人間的なアプローチを示している。
モデリング | 精度(%) |
---|---|
GPT-4o | 3.3 |
Grok-2 | 3.8 |
クロード 3.5 ソネット | 4.3 |
ジェミニ・シンキング | 6.2 |
オープンAI o1 | 9.1 |
DeepSeek-R1* | 9.4 |
OpenAI o3-mini(ミディアム)*。 | 10.5 |
OpenAI o3-mini(ハイ)*。 | 13.0 |
OpenAIディープリサーチ | 26.6 |
- このモデルはマルチモーダルではなく、テキストのみのサブセットで評価されている。
- ブラウズ+パイソンツールの使用
GAIA
ある GAIA(別ウィンドウで開きます) (実世界の問題でAIを評価するための一般公開されたベンチマーク)が、外部の深層研究を支援するモデルで新たな最先端レベル(SOTA)に達した。 リーダーボード(別ウィンドウで開きます) トップ3段階の難易度の問題を含み、これらの課題を成功させるには、推理力、マルチモーダルな流暢さ、ウェブ閲覧、ツール使用の熟練度などの能力が要求される。
GAIAタスクの例
公式例を参照:https://openai.com/index/introducing-deep-research/
エキスパートレベルのミッション
ドメイン・エキスパート・レベルの一連のタスクの内部評価では、綿密な研究は、困難な手作業による何時間もの調査を自動化したとドメイン・エキスパートから評価された。
合格率とツールコールの最大回数
モデルがスキミングをすればするほど、そしてスキミングについて考えれば考えるほど、そのパフォーマンスは向上する。
専門家レベルの課題例
公式例を参照:https://openai.com/index/introducing-deep-research/
タスクの推定経済価値は、人間が費やした時間数よりも合格率と相関している。
制限
ディープリサーチは重要な新機能を引き出したが、まだ初期段階であり、限界もある。内部評価によると、既存のChatGPTモデルよりもはるかに低いレベルではあるが、回答において幻の事実を生成したり、誤った推論を行ったりすることがある。権威ある情報と噂を区別するのが難しいかもしれませんし、信頼度校正に弱点があり、不確実性を正確に伝えられないことがよくあります。出版時のレポートや引用文に小さな書式エラーがあるかもしれず、タスクの開始に時間がかかるかもしれない。これらの問題はすべて、使用頻度の増加や時間の経過とともに急速に改善されるものと期待される。
インタビュー
ChatGPTでの深い研究には、現在非常に高い計算能力が必要です。リサーチクエリが長くなればなるほど、より多くの推論計算が必要になります。今日はまず、次のようなクエリに必要な計算から始めます。 プロユーザー最適化されたバージョンでは、月間100クエリまでご利用いただけます。プラスおよびチームユーザーアクセスの次はエンタープライズ・ユーザーです。英国、スイス、EEA(欧州経済地域)のユーザーへのアクセス提供については、現在も作業中です。
より高速で、より費用対効果の高い、高品質な結果を提供する小型モデルによる詳細な調査のバージョンがリリースされれば、まもなくすべての有料会員がより高い料金制限を利用できるようになる。
今後数週間から数ヶ月の間、私たちは技術的なインフラに取り組み、現在のリリースを注意深く監視し、より厳密なテストを実施する予定です。これは、反復的な展開という私たちの原則に沿ったものです。すべてのセキュリティ・チェックが私たちのリリース基準を満たし続ければ、約1ヶ月後にはプラス・ユーザーに詳細な調査をリリースする予定です。
フォローアップ・プラン
ディープリサーチは本日よりChatGPTネットワークで利用可能で、1ヶ月以内にモバイルとデスクトップアプリケーションに展開される予定です。現在、Deep Research はオープンなウェブとアップロードされたファイルにアクセスできます。将来的には、より専門的なデータ・ソースに接続できるようになり、サブスクリプション・ベースや社内リソースへのアクセスを拡張することで、より強力でパーソナライズされたアウトプットが可能になります。
今後は、非同期で本格的なリサーチや開発を行うために、ChatGPTのAgentエクスペリエンスを融合させることを想定しています。非同期のオンライン調査が可能なDeep Researchと、リアルなアクションが可能なOperatorを組み合わせることで、ChatGPTはますます複雑なタスクを代行できるようになるでしょう。