OpenAIのディープリサーチ：エンド・ツー・エンドのトレーニングがAIエージェントの未来をどう導くか

57.5K 00

OpenAIのIsa FulfordとJosh Tobinは最近、Training Dataポッドキャストで、同社の最新のAIエージェント製品であるDeep Researchについて詳しく取り上げ、Deep Researchは、従来の固定的なプロセスではなく、モデルのエンドツーエンドのトレーニングを使用することで、AI研究能力における大きなブレークスルーを意味すると指摘した。と述べている。

OpenAI 的 Deep Research：端到端训练如何引领 AI Agent 的未来

2人のプロダクトオーナーは、高品質のトレーニングデータとOpenAIがどのように連携しているかを詳しく説明した。 o3モデル (彼らはまた、OpenAIの最先端の推論モデルの強力な推論機能が、Deep Researchの柔軟な研究戦略にどのように貢献しているかを共有している。また、Deep Researchが知識ベースのタスクのかなりの割合を担うことを期待するSam Altman氏のビジョンも共有する。さらに、製品に対する透明性とユーザーの信頼を構築するために、Deep Research は引用元や要件の明確化プロセスなどの重要な機能を組み込むように設計された。これまで数時間かかっていた作業を数分に圧縮することで、Deep Researchは多くのビジネスや個人のアプリケーションシナリオの可能性に革命をもたらそうとしている。

同じような観点の記事を参照：未来はここにある："製品としてのモデル "時代の徹底考察

オリジナルアドレス：https://www.sequoiacap.com/podcast/training-data-deep-research/

このポッドキャストでは、OpenAIのIsa FulfordとJosh Tobinが、複数のウェブサイトを検索し、詳細な引用を含む包括的なレポートを生成することで、5～30分で包括的なオンラインリサーチを完了するAIエージェント、Deep Researchについて詳しく説明します。このエピソードでは、OpenAIがどのように効率的なAIエージェントを構築しているかを掘り下げ、商用および個人的なアプリケーションの両方でDeep Researchの将来性をプレビューします。

エンド・ツー・エンドのトレーニングは手動スケジューリングに勝る言語モデルのノードを含む固定操作グラフを構築する一般的なエージェント構築手法の代わりに、Deep Research は複雑なブラウジングタスクをエンドツーエンドで直接学習します。このアプローチにより、手動でスクリプトを作成した場合では困難な、柔軟な情報収集および統合戦略を開発することができます。
データ品質は核となる強みディープリサーチ開発の成功には、高品質のトレーニングデータが不可欠です。 OpenAIチームは o3モデル (OpenAIの最先端の推論モデル）強力な推論能力と、複雑なブラウジングタスクの入念にキュレートされた例に対するモデルの微調整、この組み合わせが非常に創造的な結果を生み出している。
エージェントは明確かつ柔軟なタスク定義が得意ディープリサーチは、厳密なルールでは捉えられない特定のワークフローを処理するためにAIエージェントを訓練できることを実証しています。このモデルは、予備的な調査結果に基づいて調査戦略を適応させることができるため、市場調査、科学文献のレビュー、消費者調査など、包括的かつ探索的な情報収集から恩恵を受ける作業に最適です。
透明性と統制が信頼を築くディープリサーチは、明確な引用、要件の事前明確化、心の連鎖の推論プロセスの可視化を通じて、ユーザーの信頼を構築します。この透明性は、複数のソースからの情報を統合するモデルの能力と相まって、ユーザーが実際に自分自身で完了することが困難な包括的な調査の恩恵を受けながら、結論を検証することを可能にする。
時間圧縮が新たな可能性を生むディープリサーチは、これまで数時間かかっていたリサーチ作業を数分に短縮します。これは時間の節約になるだけでなく、ナレッジワーカーの働き方のパラダイムを根本的に変えるものです。ユーザーは、潜在的な投資の分析や特別なイベントの計画など、以前は時間が取れなかった意思決定のための詳細な調査を行うことができるようになった。

ポッドキャスト

ジョシュ・トビン 何度も何度も、この分野で人々が教訓を学んでいるのを目にする。それは、モデルよりも賢い仕事をするために、自分たちでプログラムを書けると思っているということだ。しかし現実には、モデルが--この分野が進歩するにつれて、モデルが人間よりも優れた解決策を見つけるようになる。

そして、おそらく機械学習の包括的な教訓は、最適化したものが得られるということだ。ですから、もしあなたが望む結果に対して直接最適化できるようなシステムを構築できれば、あなたが実行しようとしているタスクに対してエンド・ツー・エンドで最適化されていないモデルをつなぎ合わせようとするよりも、結果はずっと良くなるでしょう。ですから、私の長期的な指針としては、モデルの上で強化学習を微調整することが、おそらく最も強力なエージェントを構築するための重要な部分だと考えています。

ソーニャ・ホァン OpenAI Deep ResearchのプロダクトオーナーであるIsa Fulford氏とJosh Tobin氏をお迎えします。 Deep Researchは3週間前にリリースされ、瞬く間にヒット商品となり、業界分析から医療研究、さらには誕生日パーティーのプランニングに至るまで、様々な目的でコリソン兄弟をはじめとする多くの技術著名人に利用されています！.

ディープリサーチは、エンドツーエンドの強化学習を通じて、複雑なブラウジングや推論タスクをトレーニングし、OpenAI Agent製品ファミリーの最新の追加製品です。オペレーターそれ以来2番目の製品です。 DeepResearchについて、その使用例から基礎技術、OpenAIの将来のAgent製品に期待することまで、様々なトピックについてIsaとJoshに話を聞いた。

アイザとジョシュ、ようこそ。

ローレン・リーダー ご来場ありがとうございました。ご来場ありがとうございました。

ジョシュ・トビン ここに来られて嬉しいよ。

イザ・フルフォード 招待してくれてありがとう。

ディープ・リサーチとは何か？

ローレン・リーダー では、ディープリサーチとは何かということから始めましょうか。その起源とこの製品が何をするものなのか、少し教えてください。

イザ・フルフォード ディープリサーチは、多数のオンラインサイトを検索し、非常に包括的なレポートを作成するエージェントです。人間が何時間もかけて行うようなことを行うことができます。そしてそれはチャットGPT ChatGPTは、わずか5分から30分で質問に回答できる強力なツールです。そのため、通常のChatGPTの回答よりも、より詳細で具体的なソースを使った、より深いリサーチと回答が可能です。

私たちがリリースするのはファースト・エージェント そのうちの1つです。ディープ・リサーチは2つ目のエージェントで、今後もリリースする予定です。

ソーニャ・ホァン ディープ・リサーチの原点を教えてください。いつこれをやろうと思ったのですか？インスピレーションはどこから来たのですか？開発に関わった人数は？どのようなプロセスで実現したのですか？

ジョシュ・トビン いい質問だ。これは私がOpenAIに参加する前のことだ。

イザ・フルフォード ああ、そうだね。[1年ほど前、私たちはこの新しい推論モデルを使い、反応する前に考えるようにモデルを訓練することで、社内で大きな成功を収めました。当時、私たちは主に数学と科学に焦点を当てていましたが、この新しい推論モデリング・メカニズムが解き放つもう1つのものは、エージェントの能力に関わる、より長い時間スパンのタスクを実行する能力だと思います。

私たちは、多くの人がオンラインリサーチや外部の背景情報を必要とする仕事をこなす必要があると考えています。そのようなことをするためには、非常にクリエイティブでなければなりません。このようなタスクのいくつかを解決できるモデル、あるいはモデルをトレーニングする方法がようやくできたと思います。そこで私たちは、次のようなタスクをこなすモデルのトレーニングを始めることにした。タスクを見る. 推論モデルの訓練に使ったのと同じ方法論を使うが、より現実的なタスクに適用する。

ソーニャ・ホァン これはあなたのアイデアですか？ジョシュ、あなたはどうやってこれに参加したのですか？

イザ・フルフォード ええ、最初は私と、OpenAIの同僚であるヤシュ・パティルが同じようなプロジェクトに取り組んでいました。私たちは最初のデモ版を作りました。トーマス・ディムソンはとても優秀なエンジニアで、何にでも飛び込んでいって、たくさんの仕事をしてくれる。とても面白いプロセスだったよ。

ジョシュ・トビン はい。私は半年ほど前に、自分のスタートアップからOpenAIに再加入しました。私はキャリアの初期にOpenAIで働いていたことがあり、再加入したとき、さまざまなプロジェクトを見ていて、このプロジェクトも含め、私たちのAgentプロジェクトのいくつかにとても興味を持っていました。

ローレン・リーダー 素晴らしい。どのようなユーザーグループに向けてDeep Researchを構築しているのか、詳しく教えてください。

ジョシュ・トビン そう、このツールは、日々の仕事や生活の中でナレッジ・ワークを行うすべての人のためにデザインされているのだ。例えば、市場、企業、不動産......を理解するために職場で調査を行うなど、多くのユーザーが仕事に活用しています。

イザ・フルフォード 多くの科学研究、医学研究。医療の例もたくさん見てきたと思います。

ジョシュ・トビン そうですね。私たちがとても楽しみにしていることのひとつは、何かをするのに多くの時間を費やし、たくさんのウェブ検索をし、たくさんの情報を照合しなければならないようなスタイルで、それは仕事だけに限らず、買い物や旅行にも役立つということです。

イザ・フルフォード Plusバージョンのリリースで、より多くの人がディープリサーチを試せるようになり、新しい使用例が見られるかもしれない。

ローレン・リーダー 素晴らしい。これは間違いなく、ここ数週間で最も使った製品のひとつだ。素晴らしい。

イザ・フルフォード そう言っていただけるととてもうれしいです。

ジョシュ・トビン 仕事で使っていますか？

ローレン・リーダー もちろん仕事だ。娯楽もある。

ソーニャ・ホァン 何に使うのですか？

ローレン・リーダー え、私に？なんてこった。クルマの買い替えを検討していた私は、このクルマの次世代モデルがいつ発売されるのか気になっていた。ネット上では、例えばメーカーからの様々なヒントに関する憶測的なブログ記事がたくさんあったので、ディープリサーチにこの車に関する噂や、この自動車メーカーの実際の過去のオペレーションをすべて分析してもらえないかと頼んでみた。ディープリサーチは素晴らしいレポートをまとめ、数カ月待たされるかもしれないが、今年、数カ月以内に発売されるはずだと教えてくれた。

ジョシュ・トビン そうだね。これの本当にクールなところは、特定の情報源に関するすべての情報を幅広く収集できるだけでなく、非常に曖昧で奇妙なウェブ情報を見つけるのにも非常に優れていることだ。例えば、検索結果の1ページ目には表示されないような非常に特殊なことを知りたい場合、そのようなことにも対応できるんだ。クールだ。

意外な使用例

ローレン・リーダー 驚きの使用例を教えてください。

ジョシュ・トビン ああ。

イザ・フルフォード 私が一番驚いたのは、多くの人がそれを使っていることだ。コードを書く.

ジョシュ・トビン そうだ。

イザ・フルフォード しかし、ツイッターやさまざまなチャンネルで、コードを書いたり、コードを検索したりするのに使っていると言っている人をたくさん見かけましたし、特定のパッケージに関する最新のドキュメントを見つけたり、スクリプティングの手助けをしたりするのにも使っています。

ジョシュ・トビン そうですね、ユースケースとして考えていなかったことが少し恥ずかしいです。

イザ・フルフォード [そうだね。

ジョシュ・トビン ChatGPTのユーザーにとっては当たり前のことかもしれませんが、ここまでできるのは本当にすごいことだと思います。

ソーニャ・ホァン 商業利用と個人利用のバランスは、今後どのように変化していくと思いますか？例えば、あなたはPlusバージョンについて言及しました。 1年後、2年後、これは主にビジネス用ツールになると思いますか、それとも主にコンシューマー用ツールになると思いますか？

イザ・フルフォード その両方であってほしい。とても万能な能力だと思うし、仕事でも私生活でも誰もがやっていることだと思う。だから、その両方であってほしい。

ジョシュ・トビン そうだね、どちらも楽しみだよ。ディープリサーチの魅力は、時間を大幅に節約できることだと思います。 90%を使うのに何時間もかかるようなことでも、Deep Researchに入力するだけで結果を得ることができる。そうですね、個人的な世界よりもビジネスの世界の方が、この種のタスクが多いように思います。でも、ドメインに関係なく、人々の生活の一部になることは間違いないでしょうね。

ローレン・リーダー 僕のChatGPTの主な使い方になっている。いつもレギュラーモードよりもディープリサーチを選んでいます。

イザ・フルフォード 本当に？

ローレン・リーダー [笑）。

ジョシュ・トビン そうだね。あなたはとても我慢強い。

ローレン・リーダー そのようだ。

ローレン・リーダー では、どのような消費者の使用例を見ていますか？皆さんは何に興奮していますか？

イザ・フルフォード その多くは、買い物や旅行のアドバイスに関係していると思う。私は個人的にこのモデルをよく使っています。こういったことに何カ月も使っています。ディープリサーチがリリースされた時、たまたま日本にいたのですが、特定の条件を満たすレストランや、見つからないかもしれないものを探すのにとても役立ちました。

ジョシュ・トビン はい。高価なものを買う必要があるときや、特別な旅行を計画しているときなど、じっくり考えたいときに便利だと思う。私の場合、購入したいと思っている製品について、インターネット上のすべての情報を読もうとすると、レビューやフォーラムなどを熟読するのに何時間も費やすことになる。ディープリサーチは、同じような情報をとても素早く照合してくれます。だから、そういうことには本当に便利なんだ。

イザ・フルフォード このモデルはまた、次のような点でも優れている。理解. 例えば、その商品について知りたいけど、他の商品と比較したいとか、Redditのレビュー情報も知りたいとか、いろいろな要望があると思います。

ジョシュ・トビン そうですね。もう一つのコツは、ただ表にしてくれるように頼むことです。通常もそうしてくれますが、調べたい情報のカテゴリーをすべて列挙した、引用などがたくさんある表があると本当に役立ちます。

イザ・フルフォード はい。将来的に追加される予定の機能はまだいくつかありますが、基本的なモデルは以下のことが可能です。埋め込み画像そのため、製品の画像を見つけることができる。またチャートの作成しかし、これはまだ消費者向けではありません。これらの機能がChatGPTにもすぐに実装されることを願っています。

ソーニャ・ホァン オタク消費者の使用例。[笑）。

ジョシュ・トビン そうそう、マニアックな消費者の使用例といえば。個別教育また、非常に興味深い使用例でもある。例えば、あるトピックについて学びたいと思ったとき、生物学の復習が必要なとき、あるいは世界的な出来事について学びたいときなど、自分が理解していないと感じる情報や調べてほしい部分をすべて照合して、素敵なレポートをまとめてくれるのです。

イザ・フルフォード 私の友人でCPGの会社を立ち上げようと考えている人がいるのですが、彼はディープリサーチをよく使って類似商品を調べ、特定の名前が登録されていないか、ドメインが取られていないか、市場規模の推定などをしています。彼は私とレポートを共有し、私はそれを読んでいました。それを見るのは本当に面白かった。

ジョシュ・トビン もうひとつの興味深い使用例は、インターネットを見つけるのが得意なことだ。個々の隠された事実. 例えば、ある寒いテレビ番組を探そうとしているとき、あるエピソードを探そうとしているときとか、そういうとき、もっと深く掘り下げて、ウェブ上でその番組に関する唯一の参考情報を見つけてくれる。

イザ・フルフォード ああ、そうだ。兄の友人の父親が、とても具体的な事実に関する質問をしてきたんだ。ある戦いで誰かが死んだときに権力を握っていたオーストリアの将軍についての問題だった。とてもニッチな問題でした。どうやら、ChatGPTは以前にもこの問題を間違えていたようで、彼はChatGPTの答えが間違っていることを確信していました。そこで彼は公共図書館に行き、記録を見つけ、ChatGPTが確かに間違っていることを発見した。そして、ディープリサーチが正しい答えを出すことができたので、その答えを彼に送ったところ、彼は大喜びでした。[彼は大喜びでした。］

ソーニャ・ホァン 現在、ディープリサーチが得意とするタスクの大まかなメンタルモデルは？どのシナリオでoシリーズモデルを使うべきか？ディープリサーチを使うべきシナリオは？

ジョシュ・トビン ディープリサーチが得意とするのは、もしあなたが何をしたいのかが分かっていれば詳しい説明そして、最良の答えを得るためには、インターネット上の多くの情報を読む必要がある。質問が漠然としている場合は、次のような方法があります。明らかにする何を求めるか。しかし、探すべき情報が決まっているときに最も効果的だ。

イザ・フルフォード そして、それがとても上手だと思う。適合遭遇した特定の、見つけにくい情報を見つけるのは得意だが、おそらくあまり得意ではないだろう--そして、遭遇した情報から新しい洞察を生み出すことはできるが、私は思う--。まだ新しい科学的発見をする。 Oシリーズモデルの使用に関しては、私の場合、もし私がOシリーズモデルにエンコーディング通常、モデルが事前学習で得た知識以上のものを必要としない。そのため、コーディングや o3-ミニ HIGH、僕はいつもo1 Proかo1を使っている。

エンド・ツー・エンド・トレーニング

ローレン・リーダー ディープリサーチはOpenAI 新製品の方向性その素晴らしい例です。どのように機能するのか、教えていただけますか？

イザ・フルフォード ディープ・リサーチの原動力となるモデルは o3の微調整バージョン属o3は我々の最先端の推論モデルである。. 私たちの専門分野複雑なブラウジング・タスクと他の推論タスクのコレクションで学習させた。. そのため、次のようなアクセスも可能である。ナビゲーションツール歌で応える Pythonツール. これらのタスクをエンド・ツー・エンドでトレーニングすることで、タスクを解決するための戦略を学習し、その結果、オンライン検索や分析に優れたモデルが生まれる。

ジョシュ・トビン そして、直感的に理解する方法は、あなたがこの要求をする、できればあなたが望むものについて詳細な要求をする。モデルはそれについて懸命に考え、情報を検索し、情報を抽出してそれを読み、その情報がそのリクエストにどのように関連しているかを理解し、次に何を検索すればあなたが望む最終的な答えに近づくかを決定する。そして、これらの情報をきちんとレポートにまとめ、元の情報を参照できるように訓練されている。

イザ・フルフォード エージェントの能力としてのディープ・リサーチの新しさは、その点にあると思う。エンド・ツー・エンドのトレーニングが可能だから、研究過程には事前に予測できないことがたくさんある。ですから、言語モデルやプログラム、スクリプトを記述して、モデルがトレーニングを通じて学習できるような柔軟性を持たせることは不可能だと思います。そのため、私たちは実際にこのモデルが非常に柔軟であることを目の当たりにしている。クリエイティブ・サーチ. チェーン・オブ・ソート（思考の連鎖）』の要約を読んでいただければ、次に何を探すべきか、あるいは障害を回避するために何をすべきかを考えるという点で、非常に賢いことがお分かりいただけると思います。

ソーニャ・ホァン ジョン・コリソンが発信したツイートがネット上でちょっとした炎上騒ぎになっている。ディープリサーチのマジックはどれほどのものなのか？ウェブコンテンツへのリアルタイムアクセスその数は？また思考連鎖どうしたんですか？ちょっと説明してくれる？

イザ・フルフォード それは絶対だと思うふたりの結婚. なぜなら、他の検索製品は、必ずしもエンド・ツー・エンドで訓練されているわけではないので、遭遇する情報への対応において柔軟性に欠け、特定の問題を創造的に解決する方法において創造性に欠けるからです。また、特定の問題を創造的に解決する方法という点では創造性に欠ける。つまり、その両方が組み合わさっているのだ。つまり、O3の微調整バージョンということだ。 o3 は非常にスマートでパワフルなモデルだ. 分析力の多くは、基礎となるO3モデルのトレーニングからも来ている。だから、その両方を兼ね備えているのは間違いないと思う。

ジョシュ・トビン OpenAIに参加する前、私はAgentを構築しようとしていたスタートアップで働いていました。Agentの構築方法は、私がインターネットで見たAgentの構築方法と似ていました。オペレーションチャートそのグラフのノードのいくつかは言語モデルである。このように、言語モデルは次に何をすべきかを決定するかもしれないが、発生するステップの全体的なロジックは人間が定義する。私たちは、これがプロトタイプを素早く構築する強力な方法であることを発見しましたが、モデルが直面する可能性のあるすべてのシナリオを予測し、あなたが望むかもしれないパスのさまざまな分岐を考慮することは難しいため、現実の世界ではすぐに失敗します。

その上、モデルは通常、そのグラフのノードにとって最適な意思決定者ではない。なぜなら、モデルはそのような判断をするように訓練されていないからだ。だから、このモデルが本当にパワフルなのは、次のような点だと思う。エンド・ツー・エンドのトレーニングそれは、ユーザーが解決するために使っているようなタスクを解決することができる。

ローレン・リーダー では、バックエンドでチャートを設定したり、ノードのようなアーキテクチャを決定したりする必要はないのですね？

イザ・フルフォード これは完全にモデル自身によるものだ。

ジョシュ・トビン そうだ。

ソーニャ・ホァン これについて詳しく説明してくれる？なぜなら、あなた方は非常に明確な決定そのうちの1つで、どうやらうまくいったようだ。御社のAPIを利用して、特定のユーザーのための特定のタスクをヒントで解決するアプリを構築している企業はたくさんあります。このようなアプリは、特定のワークフローについてエンド・ツー・エンドでトレーニングされた方が、より良いサービスを提供できると思いますか？

イザ・フルフォード もし、あなたのワークフローが非常に具体的で予測可能そうであれば、ジョシュの言うようなアプローチを採用することは非常に理にかなっている。しかし、多くのことを扱っているのであれば限界条件あるいは、非常に用途が広いそうであれば、ディープリサーチのようなアプローチの方がいいのかもしれない。

ジョシュ・トビン そうだ。不要モデル内凝固そのことなんだ。げんそく. モデルに触れさせたくないデータベースなどがある場合は、手作業で書いたロジックにエンコードしたほうがいい。しかし、これはこの分野で何度も何度も学んできた教訓のひとつだと思います。自分でプログラムを書けば、モデルよりも賢いことができると考えてしまう。しかし実際には、モデルが--この分野が進歩するにつれて、モデルが人間よりも優れた解決策を見つけるようになる。

ソーニャ・ホァン ディープ・リサーチを実現する上で、技術的に最も困難だったことは何ですか？

ジョシュ・トビン まあ、私は最初から関わっている人間ではなく、オブザーバーとして話すことができるかもしれないが、伊佐をはじめとするチームは懸命に働き、成功しているようだ！キーを隠すそのひとつは非常に質の高いデータセット. これは機械学習における古くからの教訓のひとつで、人々は何度も学び直している。しかし、モデルに投入するデータの質は、もう一方のモデルから得られるモデルの質を決定する最大の要因だろう。

イザ・フルフォード そして、もう一人このプロジェクトに関わっているエドワード（エドワード・サン）のように、どんなデータセットでも最適化してくれる人がいること。それが成功の秘訣だ

ローレン・リーダー エドワードを見つけよう。

ジョシュ・トビン 優れた機械学習モデルのトレーナー。

ローレン・リーダー どうやって確認するんですか？

イザ・フルフォード もちろん、それはモデルや製品の核となる部分であり、私たちはユーザーに以下のことを望んでいる。出力結果の信頼性. その理由のひとつは引用そのため、ユーザーはモデルが情報を引用しているソースを見ることができる。しかし、モデルが間違いを犯したり、幻覚を見たり、最も信頼できる情報源ではないかもしれない情報源を信用したりする可能性はある。そのため、モデルを改善し続けたい積極的な分野であることは間違いない。

ディープ・リサーチ＆オペレーター

ソーニャ・ホァン o3やOperator、その他のさまざまなリリースとの関連で、ディープリサーチについてどのように考えるべきですか？たとえば、Deep ResearchはOperatorを使用していますか? それらはすべてお互いの上に構築されているのですか？それとも、これらはすべてo3の一連の異なるアプリケーションなのでしょうか？

ジョシュ・トビン 現在、これらの製品は自立型しかし、将来のある時点で人々が究極のエージェント ウェブ検索やコンピューター操作など、人間のアシスタントにやらせたいあらゆる操作ができるだけでなく、これらの機能をより自然な形で融合させることができるはずだ。

ソーニャ・ホァン その他に、一見しただけではわからないようなデザイン上の決断をしたことはありますか？

イザ・フルフォード そのうちのひとつは明確化プロセス. ディープリサーチを使用している場合、通常ChatGPTは回答の最後に質問をすることがありますが、通常ではありません。はじめにこの振る舞いを見せるだけでいい。これはわざとするなぜなら、プロンプトが非常に明確で詳細であれば、ディープ・リサーチ・モデルから最高の回答が得られるからです。最初のプロンプトですべての情報を提供するのはユーザーの自然な行動ではないと思うので、5分でも30分でも待つのであれば、できるだけ詳細で満足のいく回答が得られるようにしたいのです。そこで、私たちは、ユーザーが必要なすべての詳細を提供していることを確認するために、追加のステップを追加しました。

また、多くの人がツイッターで、O1やO1プロに相談するプロセスを設けていると言っているのを目にした。プロンプトをより詳細にプロンプトに満足したら、それをディープ・リサーチに送るんだ。面白いね。つまり、人々はディープリサーチを使用する独自のワークフローを見つけているのだ。

ローレン・リーダー ここ数ヶ月で3つの異なるディープリサーチ製品がリリースされました。御社の製品は何が違うのか、また私たちが期待することを簡単に教えてください。

ソーニャ・ホァン どちらもディープリサーチと呼ばれているよね？

ジョシュ・トビン どちらもディープリサーチと呼ばれている。ネーミングに創造性がない. すべての製品を自分で試して、感触を確かめるべきだと思う。品質の違いは、どれも長所と短所があると思うが、違いは明らかだろう。ただ、このモデルの構築方法、データセットの構築に費やした労力、そしてOシリーズに使用しているエンジンが、モデルを最適化し、非常にインテリジェントで高品質なものにしているのです。

ソーニャ・ホァン 昨年、o1チームをポッドキャストに招き、OpenAIについて冗談を言った。 名前をつけるのは苦手だ。. ディープリサーチはあなたの最も成功した選手の名前製品[CHUCKLES]

ジョシュ・トビン ディープ・リサーチでしょ？少なくとも、それが何をするものなのかは説明できると思う。

将来展望

ローレン・リーダー 将来のビジョンをお聞かせください。今日、ディープ・リサーチを立ち上げましたが、1年後にはどうなっていると思いますか？また、その過程で他にどのような補完的なものを構築したいですか？

イザ・フルフォード 私たちは幸せだ。モデルからアクセス可能なデータソースを拡張する. 私たちが訓練するモデルは、通常、公開情報をナビゲートすることに長けていますが、次のようなこともできるはずです。個人情報の検索. そして、さらに能力向上. だから、もっとブラウジングがうまくなればいいし、もっと分析がうまくなればいい。そうですね、短期的にはそういった部分を改善したいと思っています。

ジョシュ・トビン はい。そして、これが私たちの広範なAgentロードマップにどのように適合するかを考えてみてください。例えば、このレシピは非常に幅広いユースケースに適用でき、その機能性で人々を驚かせることができると思います。しかし、そのアイデアは、最先端の推論モデルを使い、人間が仕事や日常生活を送るのと同じツールにアクセスできるようにし、エージェントに実行させたい種類の結果に対して直接最適化するというものです。このようなレシピは、複雑化するタスクに対応するためのスケーリングを妨げるものではありません。AGIはもはや運用上の問題である. そして、この普遍的なフォーミュラには、もっと多くの楽しみがあると思う。

ローレン・リーダー サム（サム・アルトマン）が、ディープリサーチは次のように語っていたのが印象的だった。経済的に価値のある全案件のうち、全世界で一桁台の割合を占める。. この言葉をどう理解すべきだろうか。

ジョシュ・トビン 私は、ディープ・リサーチは、このように理解するのが妥当だと思う。 始めたことをやり遂げることはできない。でも、あなたのために働くことはできる。控えめに時間を節約できる。数日時間の。ですから、ディープリサーチとその次に構築するエージェント、そしてその上に構築するエージェントによって、私たちが比較的達成に近づいている目標があると思います。控えめに 仕事の種類に応じて、1%、5%、10%、25%回。

ソーニャ・ホァン つまり、あなたたちは本当に自動僕の80%は動いていた。

ローレン・リーダー [私はもっと上だと思う。

ジョシュ・トビン とにかく始めるしかないと思う。小切手を書くそうだ。そうだ。

ソーニャ・ホァン どう思う？職業グループ全体もっと--"リスクがある "という表現は適切ではないが、ディープリサーチが得意とする分野に近い？例えばコンサルティングを考えているのですが、具体的にどのようなカテゴリーがそれに近いと思いますか？

ジョシュ・トビン そう、私はかつてコンサルタントだったんだ。そうですね。雇用のリスクはない. .私は、それは本当にないと思う。労働力代替スタッフしかし、このような知識ベースの仕事には、多くの時間を費やす必要がある。情報を閲覧し、結論を出すディープ・リサーチは人々に力を与えると思うじんつうりき.

イザ・フルフォード そうだね。医学ユースケースはとてもエキサイティングだ。ただ見つける病気についてだ。すべての文書もしかしたら最近の全事例その能力だ。多くの医師がディープリサーチについてネットに投稿しているのを見かけますし、私たちに連絡してきて、「ああ、私たちはディープリサーチを使ってこんなことをしました。この患者さんの臨床試験を見つけるために使いました」とか、そんな感じです。ですから、すでに多忙を極めている人や、以前は時間がなくてできなかったことがある人にとっては、時間の節約になります。

ジョシュ・トビン そうですね。その影響は、表面的に聞こえる以上に大きいと思うより深いそうでしょう？ 5%の時間を節約するだけでなく、4時間や8時間かかることが、ChatGPTのサブスクリプションと5分の時間でできるようになります。ですから、もしあなたが時間無制限あなたはどんなことをしますか？今なら何枚も何枚もコピーできるでしょう？

例えば投資可能な新興企業会う時間のある会社をリサーチするよりも？そういうことです。

ソーニャ・ホァン あるいは、消費者サイドで思い浮かぶことのひとつは、ほら。働くママ忙しくて時間がない幼児プランナーバースデーパーティー実現可能になってきた。今、実現可能になってきている。だから僕も賛成だ。 5%の時間を節約するよりもずっと重要なことだ。

ジョシュ・トビン そうだ。

ローレン・リーダー 以前はできなかったことばかりだ。

イザ・フルフォード その通りだ。

ソーニャ・ホァン これがどう変わるか教えるそして私たちするエージェントとディープリサーチの世界に入った今、子供たちに何を教えますか？エージェントとディープリサーチの世界になった今、子供たちに何を教えますか？

ジョシュ・トビン 教えるChatGPTは常に主用途ひとつ。これはChatGPT全般に言えることです。それは、あなたが話したことに基づいて、あるいは将来、あなたについて学んだことに基づいて物事を学ぶことができるAIシステムと話すことによって、物事を学ぶようなものですパーソナル教科書を読むよりも効果的で魅力的な学習方法だと感じる。

ライトニング・クエスチョン・セッション

ローレン・リーダー 我々はいくつか持っている。雷に関する質問リンクの問題。

ジョシュ・トビン オーケー。

ソーニャ・ホァン そうですね。お気に入りのディープリサーチの使用例は何ですか？

ジョシュ・トビン 例えば、そうだね。個別教育. ただ、学びたいことは何でも学ぶ。

イザ・フルフォード これはすでに述べたことだが、私は、多くの人々がこの映画について共有していると思う。見つける本人や家族について病気に関する情報個人的な話、どれも素晴らしい。

ソーニャ・ホァン 良いこと私たちは昨年、いくつかのアプリケーション・カテゴリーを見てきた。発生. 例えば。エンコーディングが明確な例だ。今年はどんなアプリのカテゴリーが爆発的に伸びると思いますか？

ジョシュ・トビン つまり。どうやらエージェントらしい。.

イザ・フルフォード これも言っておこう。

ソーニャ・ホァン オーケー。2025年はエージェントの年.

ジョシュ・トビン 私はそう思う。

ローレン・リーダー では、エージェントやAIの行く末を知るために、どんな本を読んだらいいと思いますか？著者でも構いません。

ソーニャ・ホァン トレーニングデータのポッドキャスト笑）

ジョシュ・トビン 私は、AIの最新動向を把握することが重要だと考えている至難の業. 私は人々に一般的な推奨事項はい、本当に興味のあるものを1つか2つ選んでください。サブテーマそれからね。プランナーこれに関して興味深い発言をしていると思う人のリストと、興味のある1つか2つを見つける方法。実は、これはディープリサーチの良い使用例なのかもしれない。もっと知りたいことを掘り下げるために使う。

イザ・フルフォード ちょっと古いけど、数年前に見たことがある。 学習基盤の強化 (RLの基礎）とかいうピーテル・アビールの本だ。少し古い本だが、私はこれを集中学習への素晴らしい導入.

ジョシュ・トビン そうだね。同意する ピーテル・アビールの作品なら何でも。私の卒業時の指導教官。

イザ・フルフォード ああ、そうだ。

ソーニャ・ホァン オーケー。 集中学習を終えてラッシュアワーそして、それはまた元の世界に戻っていくような気がする。下降期. 繰り返しになるが、これは現在の集中学習のダイナミクスを正しく解釈しているのだろうか？

ジョシュ・トビン 復活だ。そうだそうだ。

ソーニャ・ホァン 戻ってきた。なぜ？なぜ今なんだ？

ジョシュ・トビン につき他はすべてうまくいった。. しばらくこのスペースを見ている人なら、ヤン・ルクンのケーキを覚えているかもしれない。たとえ話?

ソーニャ・ホァン それについて話してくれ。

ジョシュ・トビン だから、もしあなたがケーキを作るそして、ケーキの大部分が本体で、その上にフロスティングが少し、そしてチェリーが乗っている。例えるなら教師なし学習ケーキのようなボディだ。教師あり学習アイシングだ。集中学習チェリー・オン・トップだ。

2015年、2016年にこの分野の強化学習研究に取り組んでいたとき、ヤン・ルクンの例えは、振り返ってみるとおそらく正しいのだと思うが、私たちは次のようなことに取り組もうとしていた。ケーキのボディはない。現状チェリーを加える. しかし、今、我々は膨大なデータの事前学習な言語モデル彼らの能力レア. 我々は、これらの言語を監督による微調整彼らは優秀だ。指示に従ってくださいそして一般的に人々が望むことをする。.

従って、これは非常に効果的そうなれば、今度はそのモデルを微調整して、彼らのために何ができるかを考えなければならない。報酬関数を定義するどのようなユースケースでも。

ソーニャ・ホァン 素晴らしい。このライトニング・クエスチョン・セッションから、ディープ・リサーチのお気に入りのAIアプリを紹介しよう。 2025年にはエージェントがブレイクする. そして。集中学習が復活した。好きだ。大好きです。参加してくれて本当にありがとう。対話を楽しんでいます。素晴らしい製品のリリース、おめでとうございます。