Разработка подсказок для моделей вывода OpenAI O1 и O3-mini

Введение: OpenAI's O1 и O3-мини это усовершенствованные "рассуждающие" модели, которые отличаются от базовой GPT-4 (широко известной как GPT-4o) тем, как они обрабатывают подсказки и генерируют ответы. Эти модели предназначены для того, чтобы тратить больше времени на "обдумывание" сложных проблем, имитируя человеческий анализ.

В этом документе представлен подробный обзор OpenAI. O1 ответить пением O3-мини Техники проектирования Prompt для моделей рассуждений. Тем не менее, те знания о структуре входных данных, возможностях рассуждений, характеристиках ответов и лучших практиках Prompt, которые изложены в этой статье, позволяют Не ограничиваясь моделями OpenAI . В связи с бурным развитием методов моделирования выводов появился целый поток таких работ, как DeepSeek-R1 и многие другие модели с превосходными возможностями рассуждений. Основные принципы и методы, изложенные в этой статье, могут также служить ценным справочным материалом, помогающим читателям использовать DeepSeek-R1 и другие аналогичные модели вывода при максимальном использовании их потенциала. Поэтому, получив представление об O1 и O3-mini Prompt EngineeringПодробные сведения сопровождаются предложением читателям подумать о том, как эти уроки можно интегрировать и применить в более широкой области моделирования выводов для раскрытия более мощных возможностей применения ИИ.

面向 OpenAI O1 与 O3-mini 推理模型的提示工程

 

Разница между O1/O3-mini и GPT-4o

Структура ввода и обработка контекста

  • Встроенные рассуждения в сравнении с рассуждениями, направляемыми подсказками: Модели серии O1 имеютВстроенные навыки рассуждения по цепочке мыслейЭто означает, что они рассуждают внутренне, без дополнительных подсказок в виде слов-подсказок. В отличие от этого, GPT-4o обычно нуждается во внешних инструкциях, таких как "давайте думать шаг за шагом", чтобы направлять его при решении сложных задач, потому что он не может автоматически выполнять многоступенчатые рассуждения такого же уровня. В O1/O3-mini вы можете просто задать вопрос, а модель сама всесторонне проанализирует.
  • Потребность во внешней информации: GPT-4o имеет обширную базу знаний и доступ к инструментам (например, просмотр, плагины, видение) в некоторых развертываниях, что помогает ему справляться с различными темами. В отличие от этого, модель O1 находится вне фокуса обученияБолее узкая база знаний. Это означает, что при использовании O1/O3-mini, если задача выходит за рамки здравого смысла, тоВажная справочная информация или контекст должны быть включены в подсказки-Не предполагайте, что модель знает нишевые факты. gpt-4o может уже знать какой-то юридический прецедент или непонятную деталь, в то время как O1 может потребовать от вас предоставить этот текст или данные.Совет Пример:
    • GPT-4o: "Анализ недавнего решения Верховного суда США о правах на аборт". (ГПТ-4о может уже обладать знаниями)
    • O1: "Проанализируйте влияние постановления о правах на аборт на американское общество в свете следующей справочной информации: [вставьте резюме соответствующих новостных сообщений и юридических документов]". (О1 может потребоваться более подробная справочная информация)
  • Длина контекста: Модель вывода имеет очень большое контекстное окно. O1 поддерживает до 128k токенов на входе, а O3-mini - до 200k токенов (до 100k токенов на выходе), что превышает длину контекста GPT-4o. Это позволяет напрямую подавать в O1/O3 большие файлы кейсов или наборы данных.Четкая организация больших объемов материалов для проектов с подсказками(И GPT-4o, и O1 могут обрабатывать длинные запросы, но более высокая емкость O1/O3 означает, что вы можете включить более подробный контекст в один ввод, что очень полезно в сложных анализах.Совет Пример:
    • "Резюмируйте основные спорные моменты дела и окончательное решение суда на основе этого длинного юридического документа, вставленного ниже. [Вставить десятки тысяч слов юридических документов]" (O1/O3-mini может эффективно обрабатывать такие длинные данные)

Способность к рассуждению и логическим выводам

  • Глубина рассуждений: O1 и O3-мини дляСистематические, многоступенчатые рассужденияОптимизированы. Они "дольше думают" перед ответом, что дает более точные решения сложных задач. Например, O1-preview решил 831 TP3T на сложном экзамене по математике (AIME), а GPT-4o - 131 TP3T, что доказывает его превосходные навыки логического вывода в профессиональном мире. GPT-4o также является мощной моделью, но имеет тенденцию к более прямолинейному генерированию ответов; без явных подсказок она может не проводить исчерпывающий анализ, что может привести к ошибкам в очень сложных ситуациях, которые могут быть охвачены O1.
  • Решение сложных задач по сравнению с простыми: Поскольку модели семейства O1 по умолчанию используют глубокий вывод, они хорошо справляются со сложными задачами с большим количеством шагов вывода (например, многогранными анализами, длинными доказательствами). Фактически, в задачах, требующих пяти и более шагов вывода, модели вывода, такие как O1-mini или O3, превосходят GPT-4 по точности более чем на 161 TP3T. Однако это также означает, чтоДля очень простых запросов O1 может "перемудрить". Было обнаружено, что в простых задачах (менее 3 шагов рассуждения) дополнительные аналитические процессы O1 могут быть недостатком - во многих случаях он не показал таких же высоких результатов, как GPT-4, из-за чрезмерного рассуждения. GPT-4o может ответить на простой вопрос более просто и быстро, в то время как O1 может генерировать ненужные анализ. Ключевое различие заключается в том, что O1 калибруется по сложностиПоэтому он может быть менее эффективным для тривиальных тестов.Совет Пример:
    • Сложные задания (подходят для O1): "Проанализировать и обобщить долгосрочные последствия изменения климата для мировой экономики, включая потенциальные риски и возможности для различных отраслей, рынка труда и международной торговли".
    • Простые задания (подходят для GPT-4o): "Какая сегодня погода?"
  • Стиль логической дедукции: При работе с головоломками, дедуктивными рассуждениями или пошаговыми задачами GPT-4o обычно нужно подсказывать, что нужно сделать (иначе он может перейти к ответу). O1/O3-mini работают с логическими выводами по-другому: они имитируют внутренние диалоги или черновики. Для пользователя это означает, что O1Итоговые ответы часто хорошо аргументированы и менее подвержены логическим пробеламОн фактически завершает "цепочку мыслей" внутри, чтобы дважды проверить последовательность. Это фактически завершает "цепочку мыслей" внутри, чтобы дважды проверить последовательность. С точки зрения подсказки, вы обычноНет необходимости говорить O1, чтобы он объяснил или проверил свою логику-- Он делает это автоматически перед представлением ответа. Для GPT-4o вы можете включить такие инструкции, как "сначала перечислите гипотезы, а затем сделайте выводы", чтобы обеспечить логическую строгость; для O1 такие инструкции часто излишни или даже контрпродуктивны.Совет Пример:
    • GPT-4o: "Решите эту логическую головоломку: [содержание головоломки]. Покажите свое решение шаг за шагом и объясните причину каждого шага".
    • O1: "Решите эту логическую головоломку: [содержание головоломки]". (O1 автоматически рассуждает логически и дает хорошо обоснованный ответ)

Определение характеристик и оптимизация выходного сигнала

  • Детали и избыточность: Благодаря глубоким рассуждениям O1 и O3-mini обычно создаются для сложных запросов.Подробные, структурированные ответы. Например, O1 может разбить математическое решение на несколько шагов или предоставить обоснование для каждой части стратегического плана. С другой стороны, GPT-4o может по умолчанию давать более краткие ответы или обобщения высокого уровня, если его не попросят дать подробное описание. С точки зрения разработки подсказок это означает, чтоОтветы O1 могут быть более длинными или техническими. Вы можете лучше контролировать эту избыточность с помощью директив. Если вы хотите, чтобы O1 был кратким, вы должны сказать ему об этом явно (как в случае с GPT-4) - в противном случае он будет стремиться к исчерпывающим выводам. И наоборот, если вы хотите, чтобы вывод былобъясните шаг за шагомGPT-4o, возможно, придется попросить включить его, в то время как O1 с радостью предоставит его, если попросить (и, возможно, сделает это внутри компании в любом случае).Совет Пример:
    • Запрос на подробное объяснение (GPT-4o): "Подробно объясните, как работает модель трансформера, включая конкретные роли каждого компонента, и используйте техническую терминологию, где это возможно".
    • Требуются лаконичные ответы (O1): "Кратко изложите основную идею модели Transformer в трех предложениях".
  • Точность и самоконтроль: Модель вывода демонстрируетСамопроверка фактовOpenAI отмечает, что O1 лучше замечает собственные ошибки во время генерации ответа, что повышает точность фактов в сложных ответах. GPT-4o обычно точен, но без руководства он может иногда уверенно ошибаться или галлюцинировать. Архитектура O1 снижает этот риск, проверяя детали в процессе "обдумывания". Пользователи отмечают, что O1 дает меньше неправильных или бессмысленных ответов на каверзные вопросы, в то время как GPT-4o для достижения такого же уровня уверенности может потребоваться применение техники подсказки (например, попросить его покритиковать или подтвердить свои ответы). Это означает, что обычно можно доверять O1/O3-mini правильно отвечать на сложные вопросы с помощью прямых подсказок, тогда как в случае с GPT-4 вам может потребоваться добавить такие инструкции, как "проверьте, соответствует ли ваш ответ приведенным выше фактам". Тем не менее, ни одна модель не является абсолютно надежной, поэтому всегда проверяйте ключевые фактические данные.Совет Пример:
    • GPT-4o (акцент на точность): "Проанализируйте цифры в этом финансовом отчете и рассчитайте маржу чистой прибыли компании. Обязательно перепроверьте цифры, чтобы убедиться в точности расчетов".
    • O1 (доверие по умолчанию): "Проанализируйте данные финансового отчета и рассчитайте маржу чистой прибыли компании".
  • Скорость и стоимость: Модель O1 медленнее и дороже для более глубоких рассуждений. O1 Pro даже включает индикатор выполнения для длинных запросов. GPT-4o более отзывчива для типичных запросов. O3-mini была представлена для обеспеченияБолее быстрые и экономичные модели рассуждений--Он намного дешевле в пересчете на токен, чем O1 или GPT-4o, и имеет меньшую задержку. Однако O3-mini - это модель меньшего размера, поэтому, хотя она и является мощной для STEM-рассуждений, она может не соответствовать полноценным O1 или GPT-4 для общих знаний или чрезвычайно сложных рассуждений. Для того чтобы обеспечить наилучшийотзывчивостьПри разработке подсказок необходимо соблюдать баланс между глубиной и скоростью: O1 может потребовать больше времени для тщательного ответа. Если задержка является проблемой, а задача не является максимально сложной, то O3-mini (или даже GPT-4o) может быть лучшим выбором.По мнению OpenAI, GPT-4o "по-прежнему является лучшим выбором для большинства подсказок", а O1 используется в основном для действительно сложных задач. Короче говоря, используйте правильный инструмент для работы - если вы используете O1, ожидайте более длительного времени отклика и планируйте его более медленный вывод (возможно, уведомив пользователя или настроив системный тайм-аут).Совет Пример:
    • Приоритет скорости (подходит для GPT-4o или O3-mini): "Кратко изложите основные положения этой статьи, чем быстрее, тем лучше".
    • Приоритет глубины (подходит для O1):"Глубоко проанализируйте логику и доказательства аргументации этой статьи и оцените убедительность ее доводов".

 

Советы по максимально эффективному использованию технических приемов

Эффективное использование O1 и O3-mini требует несколько иного подхода к кьюингу, чем GPT-4o. Ниже перечислены ключевые техники и передовые методы построения подсказок для получения оптимальных результатов от этих моделей умозаключений:

Держите наконечники чистыми и минимизированными

Изложите свою просьбу кратко и четко. Поскольку O1 и O3 проводят интенсивные внутренние рассуждения, их не интересуют целенаправленные вопросы или инструкции без посторонних текстовРеакция на лучшее. openAI и последние исследования показывают, что следует избегать использования слишком сложных или наводящих подсказок для этих моделей. На практике это означает, что вам следуетЧетко сформулируйте проблему или задачу и предоставьте только необходимые деталиНет необходимости добавлять "модификаторы" или перефразировать запрос несколько раз. Нет необходимости добавлять "модификаторы" или перефразировать запрос несколько раз. Например, вместо того чтобы написать: "В этой сложной головоломке я хочу, чтобы вы тщательно продумали каждый шаг, чтобы прийти к правильному решению. Давайте разберем ее шаг за шагом ......", лучше просто попросить: "Решите следующую головоломку [включая детали головоломки]. Объясните свои рассуждения". Модель, естественно, будет думать шаг за шагом и давать объяснения. Слишком много инструкций может привести к тому, чтоусложнить-Исследование показало, что добавление слишком большого контекста подсказки или слишком большого количества примеров можетСнижение производительности O1что, по сути, перегружает его процесс рассуждений.Совет: Для сложных задач начните с нулевого образца подсказок (только описания задач) и добавляйте дополнительные инструкции только тогда, когда обнаружите, что результат не удовлетворяет вашим потребностям. Часто минимизация подсказок дает наилучшие результаты для этих моделей вывода.

Совет Пример:

  • Простые насадки (O1/O3-mini): "Проанализируйте этот отчет о маркетинговых исследованиях, чтобы определить три наиболее важные тенденции на рынке".
  • Совет по резервированию (не рекомендуется): "У меня есть очень важный отчет об исследовании рынка, содержащий много информации, и я хотел бы, чтобы вы внимательно и вдумчиво прочитали его, глубоко обдумали и проанализировали: какие тенденции рынка наиболее важны в этом отчете? Лучше всего перечислить три наиболее важные тенденции и объяснить, почему вы считаете их самыми важными".

Избегайте неоправданно маленьких примеров

В традиционных работах с подсказками GPT-3/4 обычно используется меньшее количество примеров или демонстраций, чтобы направлять модель. Однако для O1/O3 меньше значит больше. Серия O1 специально обучена не включать подсказки с большим количеством примеров. На самом деле, использование множества примеровподорватьПроизводительность. Исследования O1-preview и O1-mini показывают, что подсказки с меньшим количеством примеров постоянно ухудшают их производительность - даже хорошо подобранные примеры во многих случаях могут сделать их хуже, чем простые подсказки. Внутренние рассуждения, похоже, отвлекаются или ограничиваются примерами. Собственные рекомендации OpenAI согласуются с этим: они рекомендуют ограничить модель умозаключений другими контекстами или примерами, чтобы не запутать ее внутреннюю логику. Лучшая практика: используйте ноль примеров или не более одного примера, который абсолютно необходим. Если вы включаете пример, сделайте его очень уместным и простым. Например, в подсказках по юридическому анализу вы обычноне будет (действовать, происходить и т.д.)Добавьте полный пример кейса заранее; вместо этого просто спросите о новом кейсе напрямую. Единственный случай, когда вы можете использовать демонстрацию, это если формат задачи очень специфичен и модель не следует инструкциям - тогда покажите короткий пример нужного формата. В остальных случаях доверьтесь модели, что она сама разберется в задаче.

Совет Пример:

  • Наконечники с нулевым образцом (оптимальный вариант): "На основании следующей информации из истории болезни диагностируйте заболевание, которое может быть у пациента. [вставить информацию из истории болезни]".
  • Меньше насадок для образцов (не рекомендуется): "Вот несколько примеров диагностики заболеваний: [пример 1], [пример 2] Теперь, пожалуйста, диагностируйте заболевание, которое может быть у пациента, основываясь на следующей информации из истории болезни. [вставить информацию из истории болезни]" (для O1/O3-mini обычно лучше работают подсказки с нулевой выборкой)

Установка ролей и форматов с помощью команд system/developer

явныйкомандный контекстПомогает направлять реакцию модели. Используйте API (или системные сообщения в диалогах) для краткого определения роли или стиля модели. Например, системное сообщение может звучать так: "Вы - профессиональный научный исследователь, который специализируется на пошаговом объяснении решений". O1 и O3-mini хорошо реагируют на такие ролевые директивы и включают их в свои рассуждения. Однако не забывайте, что они уже хорошо разбираются в сложных задачах, поэтому ваши инструкции должны быть направлены наТип вывода, который вы хотите получить** вместоКак думать. Хорошие варианты использования директивы "Система/Разработчик" включают:**

  • Определите масштаб задачи или роли: Например, "действовать как юридический аналитик" или "решать задачи, как учитель математики объясняет ученику". Это влияет на тон и уровень детализации.
  • Указывает формат вывода: Если вам нужен ответ в структурированном виде (пули, таблицы, JSON и т. д.), укажите это явно.O1, и особенно O3-mini, поддерживают структурированные режимы вывода и будут выполнять запросы на форматирование. Например, "Представьте ваши выводы в виде списка ключевых пунктов". Учитывая их логическую природу, они склонны точно следовать инструкциям по форматированию, что помогает поддерживать последовательность ответов.
  • Установите границы: Если вы хотите контролировать избыточность или сосредоточенность, можно включить такие пункты, как "предоставлять краткие выводы после детального анализа" или "использовать только предоставленную информацию и не делать никаких посторонних предположений". Модели рассуждений будут придерживаться этих границ и не позволят вам отклоняться от темы или создавать иллюзии. Это важно, потому что O1 может создавать очень подробные анализы - что обычно хорошо, но не в том случае, если вам явно нужно резюме.

Обязательно включайте все указания по тону, характеристикам, форматированию.

Пример подсказки (системного сообщения):

  • Системное сообщение: "Вы опытный юридический консультант, специализирующийся на анализе сложных судебных дел и дающий профессиональные и строгие юридические советы".
  • Совет пользователя: "Проанализируйте дело "Смит против Джонса" и определите, должен ли Джонс нести ответственность". (Модель будет проанализирована в роли и тоне юридического консультанта)

Управление избыточностью и глубиной с помощью команд

Хотя O1 и O3-mini естественно рассуждают в глубину, вы можете управлять этими рассуждениями вэкспортСтепень его отражения в Если вы хотитеЕсли вы хотите получить подробное объяснение**, предложите его (например, "Покажите в своем ответе пошаговое рассуждение"). Их не нужно подталкиватьидти вперёдрассуждения, но если вы хотитевидеть, чтоно они должны быть проинформированы. Вместо этого, если вы считаете, что ответ модели слишком длинный или технический для ваших целей, попросите ее быть более лаконичной или сосредоточиться только на определенных аспектах. Например, "Резюмируйте анализ в 2-3 абзацах, включая только самые важные моменты". Модели обычно следуют таким указаниям относительно длины или направленности. Помните, что по умолчанию O1 ведет себя тщательно - он оптимизирован для корректности, а не для краткости, - поэтому он может стремиться предоставить больше деталей. В большинстве случаев прямое требование краткости отменяет эту тенденцию. **

в отношенииO3-mini**, OpenAI предоставляет дополнительный инструмент для управления глубиной:Параметр "Сила аргументации"(Низкий, Средний, Высокий). Эта настройка позволяет модели понять, насколько сложно ей "думать". Что касается подсказок, то если вы используете API или систему, которая раскрывает эту функциональность, вы можете увеличить этот параметр для очень сложных задач (обеспечивая максимальное количество рассуждений ценой более длинных ответов и задержек) или уменьшить его для более простых задач (более быстрые, упорядоченные ответы). По сути, это еще один способ контроля избыточности и тщательности. Если у вас нет прямого доступа к этому параметру, вы можете смоделировать его, явно указав "давать быстрый ответ, глубокий анализ не требуется".низкая интенсивностьмодель для ситуаций, когда скорость важнее идеальной точности. Вместо этого для моделированиявысокая интенсивностьВы можете сказать: "Сделайте все необходимые шаги, чтобы прийти к правильному ответу, даже если объяснение будет долгим". Эти подсказки соответствуют тому, как работают внутренние настройки модели. **

Совет Пример:

  • Контроль избыточности: "Резюмируйте основные положения этой статьи, ограничившись 200 словами".
  • Глубина контроля: "Глубоко проанализируйте аргументационную структуру этого эссе и оцените, насколько оно логически обосновано и хорошо аргументировано".

Обеспечение точности при выполнении сложных задач

Чтобы получить наиболее точный ответ на сложные вопросы, пожалуйстаВоспользуйтесь моделью умозаключений в подсказке**. Поскольку O1 умеет самопроверять и даже выявлять противоречия, вы можете попросить его воспользоваться этим: например, "Проанализируйте все факты и перепроверьте свои выводы на непротиворечивость".Обычно он делает это без подсказок.Ливийская Арабская Джамахириянаращивать темпЭта команда побуждает модель быть особенно внимательной. Интересно, что, поскольку O1 уже выполняет самопроверку фактов, вам редко нужно побуждать ее к "проверке каждого шага" (что более полезно для GPT-4o). Вместо этого сосредоточьтесь на предоставлении полной и четкой информации. Если в вопросе или задании есть потенциальные двусмысленности, уточните их в подсказке или попросите модель перечислить все допущения. Это не позволит модели ошибиться с предположениями. **

Обработка источников и данных: Если ваше задание предполагает анализ данных (например, обобщение документа или вычисление ответа на основе представленных цифр), убедитесь, что вы четко представляете эти данные. O1/O3-mini с готовностью воспользуются ими. Для большей ясности можно даже разбить данные на пункты или таблицы. Если модель не должна создавать иллюзий (например, в юридическом контексте она не должна придумывать законы), дайте понять, что "ваш ответ основан только на предоставленной информации и здравом смысле; не выдумывайте никаких деталей". Модели рассуждений часто хорошо придерживаются известных фактов, и такие инструкции еще больше снижают вероятность галлюцинаций.Итерации и валидация: Если задача критическая (например, сложное юридическое обоснование или инженерные расчеты с высокой ставкой), оперативные инженерные методыинтегрированный (как в интегральной схеме)Ответ модели. Это не одна подсказка, а стратегия: вы можете выполнить запрос (или попросить модель рассмотреть альтернативные решения) несколько раз, а затем сравнить ответы. случайность O1 означает, что каждый раз она может исследовать разные пути рассуждений. Сравнивая результаты или прося модель "задуматься о существовании альтернативных объяснений" в последующих подсказках, вы можете повысить уверенность в результатах. Хотя GPT-4o также выигрывает от такого подхода, он особенно полезен для O1, когда критически важна абсолютная точность - по сути, используется глубина самой модели с помощью перекрестной проверки.

Наконец, помните, что выбор модели - это часть техники подсказок: если задача не требует рассуждений на уровне O1, возможно, эффективнее и точнее будет использовать GPT-4o. openAI рекомендует оставить O1 для сложных случаев, а для остальных использовать GPT-4o. поэтому мета-совет: сначала оцените сложность задачи. Если она простая, то либо напрямую обратитесь к O1, чтобы избежать излишней задумчивости, либо переключитесь на GPT-4o. Если она сложная, используйте описанные выше техники, чтобы задействовать возможности O1.

Совет Пример:

  • Акцент на источниках данных: "Проанализируйте товарные категории с наиболее быстрым ростом продаж в последнем квартале на основе следующей таблицы данных о продажах. [вставить таблицу данных о продажах] Обязательно используйте для анализа только данные из таблицы и не ссылайтесь на другие источники".
  • Итеративная проверка: "Проанализируйте дело "Смит против Джонса" и определите, должен ли Джонс нести ответственность. Приведите результаты вашего первоначального анализа. Затем, пожалуйста, пересмотрите свой анализ и подумайте, есть ли другие возможные объяснения или лазейки. Наконец, объедините результаты обоих анализов и дайте свое окончательное юридическое заключение". (Повышение надежности юридического анализа путем итераций и размышлений)

 

Как O1/O3-mini работает с логическими вычислениями по сравнению с GPT-4o

Эти модели рассуждений решают логические задачи принципиально иначе, чем GPT-4o, и ваша стратегия подсказок должна быть скорректирована соответствующим образом:

  • Внутренняя цепочка мыслей: O1 и O3-mini эффективно выполняют внутренний диалог или пошаговое решение, поскольку они интерпретируют ответы. Если GPT-4o не проинструктирован явно, он может не пройти строго через каждый шаг. Например, при решении логических головоломок или математических задач GPT-4o может дать быстрый ответ, который звучит правдоподобно, но пропускает часть рассуждений, что повышает риск ошибки. O1 автоматически разложит проблему на части, рассмотрев все аспекты, прежде чем дать ответ, поэтому он получает значительно больше баллов при оценке логических задач.Разница в подсказках: не просите O1 "показать вычет", если вы действительно не хотите его увидеть. Для GPT-4o вы будете использовать подсказку CoT ("Сначала рассмотрите ......, затем ......"), чтобы улучшить вычет, но для O1 это встроенная подсказка! Это может быть излишним или даже запутанным. Вместо этого просто четко сформулируйте проблему, а затем позвольте O1 дедуктивно рассуждать о ней.Совет Пример:
    • GPT-4o (нужно направить цепочку мыслей): "Решите следующую прикладную задачу по математике: [ТЕМА ЗАДАЧИ]. Выполните следующие шаги для решения задачи: 1. поймите смысл задачи; 2. проанализируйте известные и неизвестные условия; 3. перечислите шаги для решения задачи; 4. вычислите ответ".
    • O1 (без загрузки): "Решите следующую прикладную задачу по математике: [название задачи]". (O1 автоматически логически рассуждает и дает ответ)
  • Справиться с двусмысленностью: В задаче на логическое умозаключение GPT-4o может сразу же сделать предположение при недостатке информации или двусмысленности. Благодаря своему рефлексивному подходу О1 с большей вероятностью отметит двусмысленность или рассмотрит несколько возможностей. Чтобы воспользоваться этим, вы можете прямо спросить О1: "Если есть какая-то неопределенность, пожалуйста, выскажите свои предположения, прежде чем их разрешить". GPT-4, возможно, больше нуждается в таком подталкивании. О1 может делать это естественно или, по крайней мере, быть менее склонным предполагать факты, которые не даны. Таким образом, при сравнении двухВыдача O1 - осторожная и тщательная, а GPT-4o - быстро и много. Настройте свои сигналы соответствующим образом - с GPT-4o направляйте его незаметно; с O1 вам нужно в основном предоставить информацию и позволить ему делать свое дело.Совет Пример:
    • O1 (работа с двусмысленностью): "Проанализируйте этот контракт и определите, является ли он действительным. Если в ходе анализа вы обнаружите двусмысленности в каких-либо условиях, четко определите их и изложите свое понимание и предположения относительно этих двусмысленностей".
  • Прогрессивный экспорт: Иногда хочется побыть вэкспортПосмотрите логические шаги в (для обучения или прозрачности). В случае с GPT-4o вы должны явно попросить ("Пожалуйста, покажите свою работу"). Если вопрос достаточно сложный, O1 может включать структурированные рассуждения по умолчанию, но обычно он дает хорошо обоснованный ответ без необходимости явно перечислять каждый шаг, если его не просят. Если вы хотите, чтобы O1 вывел логическую цепочку, просто проинструктируйте его - он сделает это без труда. Более того, было замечено, что O1-mini способен предоставлять пошаговые декомпозиции, когда его об этом просят (например, в задачах кодирования). Кроме того, если вы(отрицательная приставка)Если вы хотите, чтобы O1 дал пространное изложение логики (возможно, вам нужен только окончательный ответ), скажите "дать окончательный ответ напрямую", чтобы пропустить подробное объяснение.Совет Пример:
    • Требуется пошаговый выход (O1): "Решите эту задачу по программированию: [описание задачи по программированию]. Покажите свое решение шаг за шагом, включая каждую строку кода, который вы написали, и объясните, что делает этот код".
    • Требуется прямой выход (O1): "Решите эту проблему программирования: [описание проблемы программирования]. Пожалуйста, укажите окончательный программный код без объяснений".
  • Логическая строгость против креативности: Еще одно отличие: для GPT-4 (и 4o) характерны креативность и генеративность. Иногда в логических задачах это может привести к тому, что он будет "выдумывать" сценарии или аналогии, что не всегда необходимо. o1 более строг и будет придерживаться логического анализа. Если в вашем задании есть сценарий, требующий как дедукции, так и творческого подхода (например, сбора подсказок), то вы можете использовать его в качестве примера.ответить пениемдобавить повествование для решения загадки), GPT-4 может лучше справиться с повествованием, в то время как O1 сосредоточится строго на дедукции. В проекте подсказки вы можете объединить их сильные стороны: использовать O1 для получения логического решения, а затем использовать GPT-4 для украшения презентации. Если вы остановитесь только на O1/O3-mini, имейте в виду, что вам, возможно, придется явно попросить их внести творческие штрихи или дать более образные ответы - они разработаны так, что приоритет отдается логике и правильности.Совет Пример:
    • Акцент на креативность (GPT-4o): "Вам предлагается сыграть роль детектива и придумать захватывающую детективную историю, основываясь на следующих подсказках, включая причину, ход и исход дела, а также мотивы и способы действий убийцы. [укажите подсказки]".
    • Акцент на логической строгости (O1): "Вам предлагается сыграть роль логика, который, основываясь на следующих подсказках, строго выводит истину по делу и объясняет логическое обоснование каждого шага рассуждений. [дать подсказки]".

Ключевые корректировки: Короче говоря, чтобы воспользоваться преимуществами логики O1/O3-mini, предлагайте им самые сложные задачи на рассуждение в виде отдельных четко сформулированных подсказок. Позвольте им самим довести логику до конца (они для этого и созданы), не контролируя их мыслительный процесс. Для GPT-4o продолжайте использовать классическую технику подсказок (разбиение проблемы на части, требование поэтапного рассуждения и т. д.), чтобы вызвать тот же уровень дедукции. И всегда подбирайте стиль подсказки в соответствии с моделью - то, что может сбить с толку GPT-4o, может оказаться подходящим для O1, и наоборот, из-за различий в методах рассуждения.

 

Подготовка эффективных советов: краткое описание лучших практик

Чтобы свести все вышесказанное в единое руководство к действию, ниже приведен список лучших практик, используемых при подаче запроса на O1 или O3-mini:

  • Используйте четкие, конкретные инструкции: Четко сформулируйте, что вы хотите, чтобы модель сделала или ответила. Избегайте не относящихся к делу деталей. Для сложных вопросов обычно достаточно прямого задания (нет необходимости использовать сложные ролевые игры или подсказки с несколькими вопросами).
  • Предоставьте необходимый контекст и опустите остальное: Включите в подсказку любую информацию из области, которая понадобится модели (факты о случае, данные о математической задаче и т. д.), поскольку модель может не обладать актуальными или узкоспециальными знаниями. Однако не включайте в подсказку нерелевантный текст или слишком много примеров - дополнительный бесполезный контент можетослаблениеМоделирование внимания.
  • Минимальное количество примеров или их полное отсутствие: По умолчанию начинайте с нулевых подсказок. Если модель не понимает задание или формат, добавьте простой образец в качестве ориентира, но не добавляйте длинные цепочки образцов для O1/O3-mini. Они в этом не нуждаются и могут даже ухудшить производительность.
  • При необходимости задайте характер или тон голоса: Используйте системные сообщения или короткие префиксы, чтобы настроить модель на нужный лад (например, "Вы - старший юрист, анализирующий дела"). . Это особенно помогает в выборе тона (формальный или повседневный) и обеспечивает соответствие языка домену.
  • Указывает формат вывода: Если вы хотите, чтобы ответ был представлен в определенной структуре (список, конспект, JSON и т. д.), пожалуйста, явно сообщите об этом модели. Модель умозаключений будет надежно следовать инструкциям по форматированию. Например, "Представьте свой ответ в виде упорядоченного списка шагов".
  • Контролируйте длину и детали по описанию: Если вам нужен короткий ответ, сделайте это явно ("ответьте в одном абзаце" или "ответьте только "да/нет" и объясните в одном предложении"). Если вам нужен глубокий анализ, поощряйте его ("предоставьте подробное объяснение"). Не предполагайте, что модель по умолчанию знает, какой уровень детализации вам нужен, - проинструктируйте ее.
  • Использование настройки силы умозаключений в O3-mini: При использовании O3-mini через API выберите соответствующую силу аргументации (низкая/средняя/высокая) для конкретной задачи. Высокий уровень дает более подробные ответы (для сложных юридических рассуждений или трудных вопросов), а низкий - более быстрые и короткие ответы (для быстрых проверок или более простых запросов). Это уникальный способ настройки поведения подсказок O3-mini.
  • Избегайте лишних "пошаговых" подсказок: не добавляйте фразы или команды типа "давайте подумаем" для O1/O3-mini; модель уже делает это внутренне. Сохраните эти лексемы и используйте такие подсказки только в GPT-4o, где они имеют значение. Исключением может быть случай, когда вы явно хотите, чтобы модель выводила каждый шаг для прозрачности - тогда вы можете использовать это вэкспортОн обязан это сделать, но вам все равно не нужно указывать ему, чтоПрактическая реализацияРассуждения.
  • Тестирование и итерации: Поскольку эти модели могут быть чувствительны к формулировкам, если вы не получаете хорошего ответа, попробуйте перефразировать вопрос или усилить инструкции. Вы можете обнаружить, что небольшие изменения (например, задавать прямые вопросы вместо открытых подсказок) дают значительно лучшие ответы. К счастью, O1/O3-mini требует меньше итераций, чем старшие модели (они часто правильно выполняют сложные задания за один присест), но корректировка подсказок все равно может помочь оптимизировать ясность или форматирование.
  • Проверяет важные выводы: В критических случаях использования не полагайтесь на один цикл "запрос - ответ". Используйте последующие подсказки, чтобы попросить модель подтвердить или обосновать свой ответ ("Вы уверены в этом выводе? Пожалуйста, объясните почему"). или повторно запустить подсказку, чтобы убедиться, что получены последовательные результаты. Последовательные и хорошо аргументированные ответы указывают на надежность рассуждений модели.

Следуя этим методикам, вы сможете использовать все возможности O1 и O3-mini с максимальной оптимизацией реакции.

 

Применение передового опыта при изучении юридических дел

Наконец, давайте подумаем, как можно воплотить эти рекомендации по проектированию в жизнь.Сценарий анализа юридического дела** (как описано ранее). Юридический анализ - прекрасный пример сложной задачи на рассуждение, в которой O1 может быть очень эффективен, если мы подготовим подсказку:**.

  • Конструкция Input: Начните с четкого изложения ключевых фактов дела и юридических вопросов, на которые необходимо ответить. Например, перечислите основные факты в виде пунктов или коротких абзацев, а затем прямо задайте юридический вопрос: "В свете вышеизложенных фактов определите, несет ли сторона А ответственность за нарушение договора в соответствии с законодательством США". Такое построение подсказки позволяет модели легче анализировать сценарий. Это также гарантирует, что никакие критические детали не будут упущены или пропущены.
  • Приведите соответствующий контекст или закон: Если речь идет о конкретных законах, прецедентах или определениях, включите их (или выдержки из них) в подсказку. O1 не имеет функции просмотра и может быть не в состоянии вспомнить нишу законов по памяти, поэтому, если ваш анализ зависит от текста конкретного закона, предоставьте его в модель. Например, "Основываясь на [выдержке из закона X], [укажите текст] ...... применяет этот закон к данному делу". Таким образом, модель получает инструменты, необходимые для точных выводов.
  • Настройка ролей в системных сообщениях: Системные инструкции, такие как "Вы - правовой аналитик, который объясняет применение закона к фактам в четкой, пошаговой манере". подтолкнут модель к созданию формального, аргументированного анализа. Несмотря на то что О1 попытался провести тщательный анализ, инструкция соответствует его тону и структуре, которые мы ожидаем увидеть в юридическом дискурсе (например, приведение фактов, применение закона, формулирование выводов).
  • Нет необходимости в многочисленных примерах: Не приводите полный пример кейса в качестве подсказки (возможно, вы захотите использовать для этого GPT-4o). O1 не обязательно следовать примеру - он может провести анализ с нуля. Однако вы можете кратко упомянуть о требуемом формате: "Представьте свой ответ в формате IRAC (вопрос, правило, анализ, вывод)". Это примечание по форматированию предоставляет шаблон без необходимости показывать длинные примеры, и O1 организует вывод соответствующим образом.
  • При необходимости управляйте резервированием: Если вам нужен исчерпывающий анализ дела, попросите O1 вывести его всестороннее обоснование. В результате может получиться несколько параграфов, в которых подробно рассматривается каждый вопрос. Если результат покажется вам слишком длинным или вам нужно краткое резюме (например, быстрое консультативное заключение), проинструктируйте модель "свести анализ к нескольким ключевым параграфам, сосредоточившись на основных вопросах". Это позволит вам получить только основные моменты. С другой стороны, если первоначальный ответ покажется вам слишком коротким или поверхностным, попросите еще раз: "Объясните более подробно, особенно как вы применяете закон к фактам". O1 будет рад рассказать подробнее, так как он уже проделал большую работу по рассуждению.
  • Точность и логическая последовательность: Юридический анализ требует точности при применении правил к фактам. С O1 вы можете доверять ему логическое решение проблем, но стоит перепроверять любые юридические ссылки или конкретные утверждения, которые он делает (поскольку его учебные данные могут не содержать всех деталей). Можно даже добавить подсказку в конце, например, "Дважды проверьте, все ли факты выяснены и соответствуют ли выводы закону". Учитывая склонность O1 к самопроверке, он может сам указать на то, что что-то не выдерживает критики или требуются другие предположения. Это полезная подстраховка в тех областях, где важны нюансы.
  • Используйте последующие запросы: В юридических сценариях принято задавать последующие вопросы. Например, если О1 дает анализ, вы можете спросить: "А что, если бы в договоре были другие условия расторжения? Как бы это изменило анализ?". O1 отлично справляется с такими итеративными вопросами, используя аргументацию. Помните, что если вы работаете над проектом, интерфейс не имеет долговременной памяти, выходящей за рамки текущего контекста диалога (и не просматривается), и каждый последующий фрагмент контента должен опираться на предоставленный контекст или включать любую новую необходимую информацию. Во избежание путаницы сосредоточьте диалог на фактах, относящихся к делу.

Применяя эти лучшие практики, ваши советы помогут O1 или O3-mini проводить высококачественный юридический анализ. Короче говоря, представляйте дела четко, распределяйте задачи, и пусть модели рассуждений выполняют всю тяжелую работу.В результате должна получиться хорошо аргументированная, пошаговая юридическая дискуссия, использующая логические способности O1, оптимизированная благодаря эффективной конструкции подсказки.

Такое использование моделей умозаключений OpenAI позволяет использовать их сильные стороны при решении сложных задач, сохраняя контроль над стилем и ясностью вывода. Как отмечается в собственной документации OpenAI, серия O1 отлично справляется с задачами глубоких рассуждений в таких областях, как исследования и стратегия - юридический анализ также выигрывает от этой особенности. Понимая различия с GPT-4o и соответствующим образом адаптируя свои методы подсказки, вы сможете максимально использовать производительность O1 и O3-mini и получать точные, хорошо структурированные ответы даже на самые сложные задачи на рассуждение.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...