Глубокое исследование OpenAI: как сквозное обучение ведет в будущее ИИ-агенты

Новости ИИОпубликовано 1 год назад Круг обмена ИИ

57.3K 00

Иза Фулфорд и Джош Тобин из OpenAI в подкасте Training Data недавно подробно рассказали о новейшем продукте компании - ИИ-агенте Deep Research, отметив, что Deep Research представляет собой большой прорыв в возможностях исследования ИИ, используя сквозное обучение моделей, а не традиционный фиксированный процесс.

OpenAI 的 Deep Research：端到端训练如何引领 AI Agent 的未来

Два владельца продуктов подробно рассказали о том, как высококачественные данные для обучения и OpenAI o3 Модели (Они также рассказывают о том, как мощные возможности современной модели вывода OpenAI способствуют гибкой исследовательской стратегии Deep Research. Они также делятся видением Сэма Альтмана относительно Deep Research, согласно которому он должен взять на себя значительную часть задач, основанных на знаниях. Кроме того, чтобы повысить прозрачность и доверие пользователей к продукту, в Deep Research были разработаны такие ключевые функции, как источники цитирования и процесс уточнения требований. Сокращая время, которое раньше занимало часы, до нескольких минут, Deep Research революционизирует возможности многочисленных сценариев применения в бизнесе и личной жизни.

Статьи с похожими точками зрения ссылка. читать:Будущее уже здесь: углубленный взгляд на эпоху "модель как продукт"

Первоначальный адрес: https://www.sequoiacap.com/podcast/training-data-deep-research/

Краткое содержание

В этом подкасте Иза Фулфорд и Джош Тобин из OpenAI рассказывают о Deep Research - агенте искусственного интеллекта, который за 5-30 минут проводит комплексное онлайн-исследование, выполняя поиск на нескольких сайтах и создавая подробные отчеты с подробными ссылками. В этом эпизоде рассказывается о том, как OpenAI создает эффективные агенты искусственного интеллекта, а также о том, какое будущее ждет Deep Research в коммерческих и личных приложениях.

Сплошное обучение превосходит ручное планирование: Вместо распространенного метода построения агентов, заключающегося в построении фиксированного операционного графа, содержащего узлы языковой модели, Deep Research обучается сквозному обучению непосредственно на сложных задачах просмотра. Такой подход позволяет модели разрабатывать гибкие стратегии сбора и интеграции информации, которые было бы сложно реализовать при ручном написании сценариев.
Качество данных является основным преимуществом: Высококачественные обучающие данные имеют решающее значение для успешного развития глубоких исследований. Команда OpenAI использует o3 Модели (современная модель вывода OpenAI) Мощные возможности вывода и тонкая настройка модели на тщательно отобранных примерах сложных задач просмотра, сочетание которых привело к появлению очень креативных результатов.
Агент умеет определять четкие, но гибкие задачиDeep Research демонстрирует, что агент искусственного интеллекта может быть обучен специфическим рабочим процессам, которые не могут быть охвачены жесткими правилами. Модель способна адаптировать стратегию исследования на основе предварительных выводов, что делает ее идеальной для таких задач, как маркетинговые исследования, обзоры научной литературы и изучение потребителей, которые выигрывают от всестороннего и исследовательского сбора информации.
Прозрачность и контроль укрепляют доверие: Deep Research укрепляет доверие пользователей благодаря четкому цитированию, предварительному уточнению требований и визуализации процесса рассуждений. Такая прозрачность в сочетании со способностью модели интегрировать информацию из нескольких источников позволяет пользователям подтверждать свои выводы, получая при этом пользу от всестороннего исследования, которое им было бы сложно выполнить самостоятельно.
Сжатие времени создает новые возможностиDeep Research позволяет сократить время выполнения исследовательских задач, на которые раньше уходили часы, до нескольких минут, что не просто экономит время, но и кардинально меняет парадигму работы специалистов в области знаний. Теперь пользователи могут проводить глубокие исследования для принятия решений, на которые раньше у них не хватало времени, например, анализировать потенциальные инвестиции или планировать специальные мероприятия.

стенограмма подкаста

Джош Тобин. Снова и снова я вижу, как люди усваивают урок в этой области, который заключается в том, что мы думаем, что можем написать собственные программы, которые будут работать лучше, чем модели. Но на самом деле, как правило, модели - по мере развития этой области - находят лучшие решения, чем человек.

И, возможно, главный урок машинного обучения заключается в том, что вы получаете то, для чего оптимизируете. Так что если вы сможете построить систему, которая позволит вам оптимизировать ее непосредственно для получения нужных результатов, результаты будут гораздо лучше, чем если вы попытаетесь собрать вместе модели, которые не оптимизированы для выполнения поставленной задачи. Поэтому в долгосрочной перспективе я считаю, что тонкая настройка обучения с подкреплением поверх моделей - это, вероятно, ключевая часть создания самого мощного агента.

Соня Хуанг. Мы рады приветствовать Ису Фулфорд и Джоша Тобина, владельцев продукта OpenAI Deep Research. Deep Research был выпущен три недели назад и быстро стал хитом, его используют многие технологические светила, такие как братья Коллисон, для различных целей, от анализа промышленности до медицинских исследований и даже планирования вечеринок на день рождения! .

Deep Research обучает сложным задачам просмотра и вывода информации с помощью сквозного обучения с подкреплением и является последним дополнением к семейству продуктов OpenAI Agent. Оператор Наш второй продукт с тех пор. Мы поговорили с Исой и Джошем о Deep Research на самые разные темы - от вариантов его использования, технологии, лежащей в его основе, до того, что мы ожидаем от будущих продуктов OpenAI для агентов.

Иса и Джош, добро пожаловать на шоу.

Лорен Ридер. Спасибо, что пришли. Большое спасибо, что присоединились к нам.

Джош Тобин. Я рад быть здесь.

Иза Фулфорд. Спасибо за приглашение.

Что такое глубокое исследование?

Лорен Ридер. Итак, давайте начнем с того, что такое Deep Research? Расскажите нам немного о его происхождении и о том, что делает этот продукт.

Иза Фулфорд. Deep Research - это агент, который выполняет поиск по большому количеству сайтов в Интернете и генерирует очень полные отчеты. Он может делать то, на что у человека ушли бы часы. И он встроен в ChatGPT ChatGPT - это мощный инструмент, который может ответить на ваши вопросы всего за 5-30 минут. Благодаря этому он позволяет проводить более глубокие исследования и отвечать на ваши вопросы, используя более подробные и конкретные источники, чем обычные ответы ChatGPT.

Это наш выпускПервый агент Один из них. Ранее мы также выпустили Operator. Так что Deep Research - это второй Agent, и в будущем мы выпустим еще несколько.

Соня Хуанг. Какова история возникновения Deep Research? Когда вы решили заняться этим? Откуда пришло вдохновение? Сколько человек участвовало в разработке? Каков был процесс воплощения этой идеи в жизнь?

Джош Тобин. Хороший вопрос. Это было до того, как я присоединился к OpenAI.

Иза Фулфорд. О, да. [Думаю, примерно год назад мы добились больших успехов в использовании новой модели умозаключений и обучении моделей думать, прежде чем отвечать. В то время мы сосредоточились в основном на математике и естественных науках, но я думаю, что еще одна вещь, которую открывает этот новый механизм моделирования умозаключений, - это возможность выполнять задачи с более длительным периодом времени, которые включают в себя возможности агента.

Мы считаем, что многим людям необходимо выполнять задания, требующие проведения онлайн-исследований или получения большого количества внешней справочной информации, что предполагает умение рассуждать и различать источники. И для выполнения таких задач нужно быть очень изобретательным. Я думаю, что у нас наконец-то появились модели или способы обучения моделей, которые позволяют решать некоторые из этих задач. Поэтому мы решили попробовать начать обучение моделей для выполненияПросмотр заданий. Используйте ту же методику, что и для обучения модели вывода, но примените ее к более реальной задаче.

Соня Хуанг. Это ваша идея? Джош, как ты в это ввязался?

Иза Фулфорд. Да, сначала это были я и Яш Патил, коллега из OpenAI, который работал над аналогичным проектом, который тоже будет выпущен в какой-то момент, и мы были очень рады этому. Мы создали начальную демо-версию. А Томас Димсон, который является очень хорошим инженером, погрузится во все и сделает много работы. Так что это был очень интересный процесс.

Джош Тобин. Да, я присоединился немного позже. Я вернулся в OpenAI около шести месяцев назад из своего собственного стартапа. Я работал в OpenAI ранее в своей карьере, и когда я вернулся, я следил за различными проектами и был очень заинтересован в некоторых из наших проектов по агентам, включая этот, и тогда я принял участие.

Лорен Ридер. Это замечательно. Пожалуйста, уточните, для каких групп пользователей вы создаете Deep Research.

Джош Тобин. Да, он предназначен для всех, кто занимается знаниями в своей повседневной работе или жизни. Мы видим, что многие пользователи используют его для своей работы, например, проводят исследования на работе, чтобы понять рынки, компании, недвижимость .......

Иза Фулфорд. Большое количество научных исследований, медицинских исследований. Думаю, мы видели много примеров из области медицины.

Джош Тобин. ДА. Один из моментов, который нас очень радует, - это стиль: мне приходится тратить много времени на то, чтобы что-то делать, искать в Интернете и собирать много информации, и это не только для работы, но и для шопинга и путешествий.

Иза Фулфорд. Поэтому мы с нетерпением ждем выхода версии Plus, чтобы больше людей смогли попробовать Deep Research и, возможно, увидеть новые варианты использования.

Лорен Ридер. Отлично. Это определенно один из продуктов, которым я пользовалась больше всего за последние несколько недель. Он превосходен.

Иза Фулфорд. Мне так приятно слышать это от вас.

Джош Тобин. Используете ли вы его для работы?

Лорен Ридер. Работа, конечно. Но есть и развлечения.

Соня Хуанг. Для чего вы его используете?

Лорен Ридер. О, для меня? Ну и дела. Я подумывал о покупке нового автомобиля и задавался вопросом, когда выйдет следующее поколение этой машины. В интернете было много спекулятивных записей в блогах о различных намеках от производителя, например, поэтому я спросил у Deep Research, не могли бы вы проанализировать все слухи об этом автомобиле и все реальные предыдущие операции этого автопроизводителя. Компания подготовила отличный отчет и сообщила мне, что, возможно, до выхода автомобиля еще несколько месяцев, но он должен быть выпущен в этом году, в течение ближайших нескольких месяцев.

Джош Тобин. ДА. Одна из его особенностей заключается в том, что он не только собирает всю информацию о конкретном источнике, но и отлично справляется с поиском очень странной и непонятной веб-информации. Например, если вы хотите узнать что-то очень специфическое, что может не появиться на первой странице результатов поиска, он отлично справится и с этим. Это круто.

Удивительные примеры использования

Лорен Ридер. Какие удивительные примеры использования вы видели?

Джош Тобин. О.

Иза Фулфорд. Самое удивительное для меня - это количество людей, которые используют его для того, чтобыНапишите код.

Джош Тобин. Да.

Иза Фулфорд. Это не совсем тот случай, который я рассматривал, но я видел, как многие люди говорили в Twitter и на различных каналах, где мы можем получить обратную связь, что они используют его для написания кода и поиска кода, а также для поиска последней документации по определенному пакету и для помощи в написании сценариев или чего-то еще.

Джош Тобин. Да, мне немного стыдно, что мы не подумали об этом как о варианте использования.

Иза Фулфорд. [Да.

Джош Тобин. Пользователям ChatGPT это может показаться очевидным, но меня впечатляет, что он делает это так хорошо.

Соня Хуанг. Как, по-вашему, со временем будет меняться баланс между коммерческим и личным использованием? Например, вы упомянули о грядущей версии Plus. Как вы думаете, через год или два это будет преимущественно бизнес-инструмент или преимущественно потребительский инструмент?

Иза Фулфорд. Я надеюсь, что и то, и другое. Я думаю, что это очень универсальная способность, и я думаю, что это то, что мы все делаем в нашей работе и личной жизни. Так что я надеюсь, что это и то, и другое.

Джош Тобин. Да, я с нетерпением жду и того, и другого. Я думаю, что волшебство заключается в том, что это действительно экономит людям много времени. Если есть что-то, что может занять у вас несколько часов - в некоторых случаях, как мы слышали, даже дней, - люди могут просто ввести это в Deep Research и получить свои собственные результаты, на которые ушло бы много времени в 90%. Так что да, я склонен думать, что в мире бизнеса таких задач больше, чем в личном мире. Но я уверен, что это будет частью жизни людей, независимо от сферы деятельности.

Лорен Ридер. Это стало моим основным способом использования ChatGPT. Я всегда выбираю Deep Research вместо обычного режима.

Иза Фулфорд. Правда?

Лорен Ридер. [Смех].

Джош Тобин. Да, конечно. Ты такой терпеливый.

Лорен Ридер. Видимо, так.

Лорен Ридер. Итак, какие варианты использования для потребителей вы видите? Что вызывает у вас восторг?

Иза Фулфорд. Я думаю, что во многом это связано с советами по шопингу и путешествиям. Лично я часто пользуюсь этой моделью. Я использую ее для этих целей уже несколько месяцев. Мы оказались в Японии в момент выхода Deep Research, и она очень помогла мне найти рестораны, которые отвечают определенным требованиям, а также те, которые я мог бы не найти.

Джош Тобин. ДА. Я считаю, что это полезно, когда вам нужно купить что-то дорогое, или вы планируете особенную поездку, или хотите потратить много времени на обдумывание. Я могу часами читать всю информацию в интернете о продукте, который хочу купить, изучать все обзоры, форумы и тому подобное. А Deep Research может собрать подобную информацию очень быстро. Так что он очень полезен для таких случаев.

Иза Фулфорд. Модель также очень хороша впонимание. Так что если ваш запрос содержит много разных частей или много разных вопросов, например, вы хотите узнать о продукте, но также хотите сравнить его со всеми другими продуктами, а также узнать об отзывах на Reddit и так далее, вы можете сделать много разных запросов, и он сделает все это за вас.

Джош Тобин. Да. Еще один прием - просто попросить представить информацию в виде таблицы. Обычно так и делают, но очень помогает таблица с большим количеством цитат и т. п., в которой перечислены все категории информации, которую вы хотите исследовать.

Иза Фулфорд. ДА. В будущем ожидается добавление некоторых функций, но базовая модель способнаВстроенные изображенияТак что он может найти изображения продукта. Кроме того, он способенСоздание диаграммкоторые затем вставляют эти графики в свои ответы, но это пока не является потребительским вариантом использования. Надеемся, что в скором времени эти функции будут реализованы и в ChatGPT.

Соня Хуанг. Варианты использования для гиков. [Смех].

Джош Тобин. Да, кстати, о гиковских потребительских сценариях использования.персонализированное образованиеЭто также очень интересный вариант использования. Например, если вы давно хотели изучить какую-то тему, подтянуть биологию или узнать о событиях в мире, он отлично справится с задачей сбора информации, которая вам кажется непонятной, и тех аспектов, которые вы хотели бы изучить, а затем составит для вас прекрасный отчет.

Иза Фулфорд. У меня есть друг, который собирается открыть компанию по производству потребительских товаров, и он часто использовал Deep Research для поиска похожих продуктов, чтобы узнать, были ли зарегистрированы определенные имена, заняты ли домены, чтобы оценить размер рынка и так далее. Это было интересно - он делился со мной отчетами, а я их читал. Так что было очень интересно посмотреть на это.

Джош Тобин. Еще один интересный вариант использования: он отлично справляется с поиском информации в Интернете.Отдельные, скрытые факты. Например, если вы пытаетесь найти какую-то холодную телепередачу, найти определенный эпизод или что-то в этом роде, он копнет глубже и найдет единственную справочную информацию о ней в Интернете.

Иза Фулфорд. О, да. У отца друга моего брата был очень специфический вопрос по фактам. Вопрос касался австрийского генерала, который был у власти, когда кто-то погиб в определенной битве. Это был очень нишевый вопрос. Судя по всему, ChatGPT уже отвечал на него неправильно, и он был уверен, что ответ ChatGPT был неправильным. Поэтому он отправился в публичную библиотеку, нашел запись и обнаружил, что ChatGPT действительно ошибся. А потом Deep Research смог дать правильный ответ, и мы отправили ему ответ, и он был в восторге. [Смех]

Соня Хуанг. Каковы ваши примерные ментальные модели для задач, с которыми Deep Research сегодня очень хорошо справляется? Для каких сценариев следует использовать модель o-series? В каких сценариях следует использовать Deep Research?

Джош Тобин. В чем Deep Research действительно хороша, так это в том, что если у вас есть понимание того, что вы хотитеподробное описаниеДля того чтобы получить наилучший ответ, необходимо прочитать много информации в Интернете. Если ваш вопрос расплывчатый, вам может помочьпрояснитьЧто вам нужно. Но лучше всего он работает, когда у вас есть определенный набор информации, которую нужно искать.

Иза Фулфорд. И я думаю, что у нее это очень хорошо получается.соответствоватьОн очень хорош в поиске специфической, труднодоступной информации, но, вероятно, не очень хорош в этом - и он может генерировать некоторые новые идеи из информации, которую он встречает, но я думаю - онпока нетСовершайте новые научные открытия. Что касается использования модели серии o, то для меня, если я попрошу ее сделать то же самое, что и моделькодировкисвязанные с этим вещи, которые обычно не требуют знаний, превышающих те, что модель получила в результате предварительного обучения. Таким образом, для кодирования или o3-mini HIGH, я обычно использую o1 Pro или o1.

Комплексное обучение

Лорен Ридер. Deep Research - это OpenAI Направление новых продуктовОтличный пример этого. Мне любопытно, насколько вы можете поделиться, как это работает?

Иза Фулфорд. Модель, которая лежит в основе Deep Research, такова Уточненная версия o3(математика) родo3 - наша современная модель вывода.. Мы специализируемся наМы обучили его на нашей коллекции сложных задач по просмотру сайтов, а также на других задачах, связанных с рассуждениями.. Как таковой, он также имеет доступ кнавигационный инструментответить пением Инструменты Python. Благодаря сквозному обучению на этих задачах, он учится стратегиям их решения, а полученные модели отлично справляются с поиском и анализом в Интернете.

Джош Тобин. Интуитивно это можно понять так: вы делаете запрос, желательно подробный, о том, чего вы хотите. Модель хорошенько подумает над этим, поищет информацию, извлечет ее и прочитает, поймет, как эта информация связана с запросом, а затем решит, что искать дальше, чтобы приблизиться к окончательному ответу, который вы хотите получить. И он обучен хорошо обобщать всю эту информацию в виде аккуратного отчета со ссылками, указывающими на исходную информацию, которую он нашел.

Иза Фулфорд. Да, я думаю, что новизна глубокого исследования как возможности агента заключается в том, что, поскольку мыВозможность комплексного обученияТак что в процессе исследования есть много вещей, которые невозможно предсказать заранее. Поэтому я не думаю, что можно написать какую-то языковую модель или программу или скрипт, который сделает ее настолько гибкой, насколько модель может научиться в процессе обучения, где модель фактически реагирует на сетевую информацию в реальном времени и в зависимости от того, что она видит, она должна изменить свою стратегию и так далее. Таким образом, мы видим, что она делает оченьТворческий поиск. Вы можете прочитать краткое содержание "Цепочки мыслей", и я уверен, что иногда вы увидите, что она очень умна в плане того, чтобы понять, что искать дальше или обойти препятствия.

Соня Хуанг. Джон Коллисон опубликовал твит, который вызвал небольшой пожар в интернете. Сколько магии Deep Research получает отДоступ к веб-контенту в режиме реального времениА сколько от И сколько изцепочка мыслейЧто происходит? Вы можете немного объяснить?

Иза Фулфорд. Я думаю, что это абсолютнобрак двух. И я думаю, вы можете видеть это, потому что есть и другие поисковые продукты, которые не обязательно проходят сквозное обучение, и поэтому не так гибко реагируют на информацию, которая им попадается, и не так креативны в плане творческого решения конкретных проблем, и не так быть настолько креативными, потому что их не обучали специально для этого. Так что это определенно сочетание обоих факторов. Я имею в виду, что это усовершенствованная версия o3. o3 это очень умная и мощная модель. Много аналитической силы также дает обучение модели o3, лежащей в основе. Так что я думаю, что это определенно комбинация того и другого.

Джош Тобин. До прихода в OpenAI я работал в стартапе, где мы также пытались создать агентов, и способ их создания был похож на то, как большинство людей, которых я видел в интернете, описывают создание агентов, то есть в основном вы создаетесхема работыНекоторые из узлов этого графа являются языковыми моделями. Таким образом, языковая модель может решать, что делать дальше, но общая логика происходящих шагов определяется человеком. Мы обнаружили, что это мощный способ быстрого создания прототипов, но в реальном мире он быстро дает сбой, потому что трудно предсказать все сценарии, с которыми может столкнуться модель, и рассмотреть различные ветви пути, по которому вы можете пойти.

Кроме того, модели, как правило, не могут принимать оптимальные решения для узлов графа, поскольку они не обучены принимать такие решения. Они обучены делать то, что похоже на них. Поэтому я думаю, что эта модель действительно сильна тем, что онаПосле непосредственного сквозного обучениякоторый может решать такие задачи, которые ставят перед ним пользователи.

Лорен Ридер. Значит, вам не нужно настраивать графики или принимать узловые архитектурные решения на задней стороне?

Иза Фулфорд. Это полностью зависит от самой модели.

Джош Тобин. Да.

Соня Хуанг. Вы можете рассказать об этом подробнее? Потому что кажется, что вы, ребята, сделалиОчень четкие решенияОдин из них, и, судя по всему, он сработал. Существует множество компаний, создающих приложения на базе вашего API, которые решают конкретные задачи для конкретных пользователей с помощью подсказок. Как вы думаете, будут ли эти приложения лучше работать, если их обучить всем специфическим рабочим процессам?

Иза Фулфорд. Я думаю, что если ваш рабочий процесс оченьКонкретные и предсказуемыеТогда применение подхода, описанного Джошем, имеет большой смысл. Однако если вы имеете дело с большим количеством вещейПредельные условияили нужно быть оченьуниверсальныйТогда лучшим вариантом может стать подход, аналогичный Deep Research.

Джош Тобин. Да, я советую людямНежелательныев моделизастывание (химия)Дело в том, что вы знаете.жёсткое правило. Если у вас есть база данных или что-то подобное, чего вы не хотите, чтобы модель касалась, лучше закодировать это в логике, написанной вручную. Но я думаю, что это один из уроков, которые я вижу, как люди снова и снова усваивают в этой области: мы думаем, что можем делать более умные вещи, чем модели, написав свои собственные программы. Но на самом деле обычно модели - по мере развития этой области - находят лучшие решения, чем человек.

Соня Хуанг. Каковы были самые большие технические трудности при реализации Deep Research?

Джош Тобин. Ну, может быть, я могу говорить как наблюдатель, а не как человек, который участвовал в проекте с самого начала, но, похоже, Иса и остальная команда очень усердно работали и, похоже, преуспели!Спрячьте ключОдин из моментов заключается в том, что созданиеНаборы данных очень высокого качества. Это один из тех извечных уроков машинного обучения, которые люди продолжают заново изучать. Но качество данных, которые вы подаете в свою модель, вероятно, является самым большим фактором, определяющим качество модели, которую вы получаете на другом конце.

Иза Фулфорд. А еще нужно иметь такого человека, как Эдвард (Эдвард Сан), который является еще одним участником этого проекта, и который оптимизирует любой набор данных. Это и есть рецепт успеха.

Лорен Ридер. Найдите своего Эдварда.

Джош Тобин. Отличный тренер моделей машинного обучения.

Лорен Ридер. Как вы убеждаетесь, что все правильно?

Иза Фулфорд. Да, очевидно, это основная часть модели и продукта, и мы хотим, чтобы пользователи моглиУверенность в результатах. Отчасти потому, что у насцитироватьТаким образом, пользователь может видеть источник, из которого модель черпает информацию. В процессе обучения мы стараемся убедиться в том, что все правильно, но модель все равно может ошибаться, галлюцинировать или доверять источникам информации, которые могут быть не самыми надежными. Так что это определенно активная область, в которой мы хотим продолжать совершенствовать модель.

Глубокое исследование и оператор

Соня Хуанг. Как мы должны думать о Deep Research по отношению к o3, Operator и другим различным релизам? Например, использует ли Deep Research Operator? Все ли они построены друг на друге? Или все они представляют собой ряд различных приложений o3?

Джош Тобин. В настоящее время эти продуктыотдельно стоящийНо вы можете себе представить, куда мы движемся в будущем, когда люди в какой-то момент получат доступ кУниверсальный агент Он должен не только уметь выполнять поиск в Интернете, пользоваться компьютером или выполнять любые другие операции, которые вы хотели бы, чтобы выполнял человеческий помощник, но и сочетать все эти функции более естественным образом.

Соня Хуанг. Какие еще дизайнерские решения вы принимали, которые могут быть неочевидны на первый взгляд?

Иза Фулфорд. Я думаю, что один из нихПроцесс разъяснения. Если вы использовали Deep Research, модель задаст вам вопросы до начала исследования, тогда как обычно ChatGPT задает вопросы в конце своих ответов, но не в самом начале.с самого началаПросто покажите это поведение. Этоделать что-то намеренноПотому что если подсказка будет очень четкой и подробной, вы получите лучший ответ от модели Deep Research. И я не думаю, что естественным поведением пользователя является предоставление всей информации в первой подсказке, поэтому мы хотим убедиться, что если вы собираетесь ждать 5 минут, 30 минут, то ваш ответ будет максимально подробным и удовлетворительным. Поэтому мы добавили эти дополнительные шаги, чтобы убедиться, что пользователь предоставит все необходимые нам сведения.

И я действительно видел, как многие люди говорили в Twitter, что у них есть процесс, в котором они обращаются к o1 или o1 Pro, чтобы помочьСделайте их подсказки более подробнымиИ как только они довольны подсказкой, они отправляют ее в Deep Research. Это интересно. Значит, люди находят свои собственные рабочие процессы для использования Deep Research.

Лорен Ридер. За последние несколько месяцев было выпущено три разных продукта Deep Research. Пожалуйста, кратко опишите, чем отличается ваш продукт и чего нам следует от него ожидать.

Соня Хуанг. И оба они называются Deep Research, верно?

Джош Тобин. Оба они называются "Глубокие исследования". Да, эта областьНе слишком творческий подход к наименованию. Я думаю, что люди должны сами попробовать все эти продукты и почувствовать их. Я думаю, что разница в качестве, я думаю, что у всех есть плюсы и минусы, но я думаю, что разница будет очевидна. Но все сводится к тому, как построена эта модель, какие усилия прилагаются к созданию набора данных и движка, который мы используем для моделей серии o, что позволяет нам оптимизировать модель и сделать ее очень интеллектуальной и высококачественной".

Соня Хуанг. В прошлом году мы пригласили команду o1 на подкаст и пошутили, что OpenAI Не очень хорошо умею называть вещи.. Я бы сказал, что Deep Research - это вашНазывая самые успешныеПродукт. [CHUCKLES]

Джош Тобин. Deep Research, верно? По крайней мере, это описывает то, чем она занимается, я думаю.

прогноз на будущее

Лорен Ридер. Мне бы хотелось услышать ваше видение будущего. Вы запустили Deep Research сегодня. Как вы думаете, как он будет выглядеть через год? Может быть, какие еще дополнительные вещи вы хотите создать в процессе?

Иза Фулфорд. Мы счастливы.Расширение источников данных, доступных для модели. Модель, которую мы обучаем, обычно очень хорошо ориентируется в публичной информации, но она также должна уметьПоиск частных данных. И потом, я думаю, это просто дальнейшееУкрепление их потенциала. Так что он может быть лучше в просмотре, он может быть лучше в анализе. Да, я думаю, в ближайшей перспективе мы хотим улучшить эти области.

Джош Тобин. Да, это так. А потом подумайте, как это вписывается в нашу более широкую дорожную карту агентов. Я думаю, что этот рецепт может быть использован в очень широком спектре случаев, которые удивят людей тем, насколько хорошо он работает. Но идея заключается в том, что вы берете самую современную модель умозаключений, предоставляете ей доступ к тем же инструментам, которые люди могут использовать для выполнения своей работы или повседневной жизни, а затем оптимизируете ее непосредственно для тех видов результатов, которые вы хотите, чтобы Агент мог выполнять. Такому рецепту ничто не мешает масштабироваться на все более сложные задачи, так что мне кажется, что да.AGI теперь является оперативной проблемой. И я думаю, что в этой универсальной формуле есть еще много чего интересного.

Лорен Ридер. Сэм (Сэм Альтман) привел очень яркую цитату, когда сказал, что Deep Research будетВозьмите на себя однозначный процент всех экономически ценных заданий по всему миру. Как мы должны понимать это утверждение?

Джош Тобин. Думаю, справедливо понимать, что Deep Research Невозможно закончить начатое.Но это может сработать и для вас.использовать экономночасов, а в некоторых случаях даже сэкономитьнесколько днейвремени. Поэтому я думаю, что цель, к достижению которой мы, возможно, уже близки, заключается в том, что Deep Research, а также агент, который мы создадим следующим, и агент, который мы создадим на его основе, дадут вамиспользовать экономно 1%, 5%, 10%, 25% раз, в зависимости от типа выполняемой вами работы.

Соня Хуанг. Я имею в виду, я думаю, что вы, ребята, действительноавтоматическийУ меня работал 80%, так что .......

Лорен Ридер. [Для меня определенно выше.

Джош Тобин. Я думаю, нам просто нужно начать.выписать чекДа. Да, это так.

Соня Хуанг. Что вы думаетеВся профессиональная группаБольше - "в зоне риска" не совсем верное слово, но ближе к тем областям, в которых Deep Research очень хороша? Я думаю о консалтинге, например, но какие конкретные категории, по-вашему, ближе к этому?

Джош Тобин. Да, раньше я был консультантом. Я думаю.Ни одно рабочее место не находится под угрозой. Я действительно не думаю, что этоЗамещение рабочей силыВещи. Однако для таких видов работы, основанных на знаниях, необходимо потратить много времени, чтобыПросматривайте информацию и делайте выводыЯ думаю, что Deep Research расширит возможности людей.сверхъестественная сила.

Иза Фулфорд. Да, я интересуюсь многимиизучение медициныВарианты использования очень интересны. ТольконайтиРечь идет о болезни.Все документывозможноВсе последние делаВозможность сделать это. Мне кажется, я видел, как многие врачи писали в Интернете о Deep Research или связывались с нами и говорили: "О, мы сделали это с его помощью. Мы использовали его, чтобы найти клиническое исследование для этого пациента" или что-то в этом роде. Так что это просто экономия времени для людей, которые и так очень заняты или у которых раньше не хватало времени, а теперь они могут получить доступ к этой информации.

Джош Тобин. Да. И я думаю, что последствия этого могут быть более серьезными, чем кажется на первый взгляд.более глубокий, верно? Это не просто экономия времени 5%, это то, что то, на что у вас может уйти 4 или 8 часов, вы можете сделать с помощью подписки ChatGPT и 5 минут своего времени. Так что если у вас естьНеограниченное времяЧем вы занимаетесь? Теперь вы, наверное, сможете сделать много-много копий?

Например, вы должны изучить каждыйВозможные стартапы для инвестированияНе просто изучайте компании, с которыми у вас есть время встретиться? И все в таком духе.

Соня Хуанг. А если говорить о потребителях, то одна из вещей, которая приходит на ум, - это... ну, вы понимаете.Работающие мамыСлишком занят, чтобы найти время длямалышпланировщикдень рожденияТеперь это становится возможным. Теперь это становится возможным. Так что я с тобой согласен. Это гораздо важнее, чем экономия времени 5%.

Джош Тобин. Да.

Лорен Ридер. Это те вещи, которые вы не могли сделать раньше.

Иза Фулфорд. Именно так.

Соня Хуанг. Как это изменитсяобучатьи мысделатьЧему бы вы научили детей сейчас, когда мы живем в мире агентов и глубоких исследований? Теперь, когда мы живем в мире агентов и глубоких исследований, чему бы вы научили детей?

Джош Тобин. обучатьChatGPT всегда использовалсяосновное использованиеПервое. Я думаю - и это справедливо для ChatGPT в целом. Это все равно что учиться, общаясь с системой искусственного интеллекта, которая может учиться на основе того, что вы ей говорите, или в будущем - на основе того, что она узнает о вас.персонализированныйОна предоставляет вам информацию, что кажется более эффективным и увлекательным способом обучения, чем чтение учебника.

Молниеносная сессия вопросов

Лорен Ридер. У нас есть нескольковопрос о молнииПроблема со ссылкой.

Джош Тобин. Хорошо.

Соня Хуанг. Правильно. Каковы ваши любимые примеры использования Deep Research?

Джош Тобин. Я бы сказал "да", например.персонализированное образование. Просто научиться всему, чему захочу.

Иза Фулфорд. Я уже говорил об этом, но мне кажется, что многое из того, что люди рассказывают онайтиО них или их семьяхИнформация о перенесенных заболеванияхЛичные истории, все они великолепны.

Соня Хуанг. Хорошее. За последний год мы увидели несколько категорий приложенийвспышки. Например.кодировкиявляется ярким примером. Какие категории приложений, по вашему мнению, взорвутся в этом году?

Джош Тобин. Я имею в виду.Очевидно, агент..

Иза Фулфорд. Я тоже скажу это.

Соня Хуанг. Хорошо.2025 год - год агента.

Джош Тобин. Думаю, да.

Лорен Ридер. Итак, как вы думаете, что стоит порекомендовать людям, чтобы узнать больше о том, куда движется агент или искусственный интеллект? Это также могут быть авторы.

Соня Хуанг. Подкаст Training Data. [Смех].

Джош Тобин. Я считаю, что важно быть в курсе последних достижений в области искусственного интеллекта.очень трудно. Я даю людямОбщие рекомендацииДа, выберите один или два, которые вас действительно интересуют.подтемаА потом, знаете.планировщикСписок людей, которые, по вашему мнению, делают интересные заявления по этому поводу, и как найти одну или две вещи, которые вас интересуют. Возможно, на самом деле это хороший вариант использования Deep Research. Используйте его, чтобы углубиться в то, о чем вы хотите узнать больше.

Иза Фулфорд. Это уже немного устарело, но, кажется, я читал ее несколько лет назад - кажется, она называлась Укрепление основ обучения (Основы РЛ) или что-то в этом роде, от Питера Аббела. Она немного устарела, но я думаю, что этоОтличное введение в интенсивное обучение.

Джош Тобин. Да, конечно.соглашаться с Все, что написано Питером Аббелем. Мой советник по аспирантуре.

Иза Фулфорд. О, да.

Соня Хуанг. Хорошо. Интенсивное обучениеПослечас пикА потом он словно падает обратно вспад. И снова возникает вопрос, является ли это правильной интерпретацией текущей динамики интенсивного обучения?

Джош Тобин. Он вернулся.Да. Да.

Соня Хуанг. Она вернулась. Почему? Почему именно сейчас?

Джош Тобин. по причинеВсе остальное работало.. Думаю, если кто-то давно следит за этим пространством, он может вспомнить торт Янна ЛеКуна.притчи?

Соня Хуанг. Поговорите об этом.

Джош Тобин. Так что, если вы собираетесьПриготовьте тортТогда основная часть торта - это тело торта, а затем немного глазури и вишни сверху. Аналогия заключается в том, чтонеконтролируемое обучениеЭто тело для торта.Контролируемое обучениеЭто глазурь.Интенсивное обучениеЭто вишенка на вершине.

Я думаю, что когда мы работали над исследованиями в области обучения с подкреплением в этой области в 2015, 2016 годах, аналогия Янна ЛеКуна, которая, как я думаю, в ретроспективе, вероятно, верна, заключалась в том, что мы пытались работать надНет корпуса для торта.нынешняя ситуацияДобавить вишню. Но теперь, когда у нас есть вПредварительное обучение на массивных данных(используется в форме номинального выражения)языковая модельИх способностьредкий. Мы знаем, как моделировать эти языки наТонкая настройка надзораОни хороши в своем деле.Следуйте инструкциями вообщеДелают то, что хотят от них люди..

Поэтому, поскольку этоочень эффективныйтогда настало время доработать эти модели, чтобы они соответствовали тому, что вы можете сделать для ихОпределите функцию вознаграждениядля любого типа использования.

Соня Хуанг. Отлично. Итак, в результате этой молниеносной сессии вопросов мы получили любимые приложения Deep Research для ИИ. Агент станет самой популярной категорией в 2025 году. И.Интенсивное обучение возвращается.Мне нравится. Мне нравится. Большое спасибо, что присоединились к нам. Мы наслаждаемся диалогом. Поздравляю с выпуском отличного продукта, и мы с нетерпением ждем, что он принесет.