Введение в OpenAI o1-preview

База знаний по искусственному интеллекту2年前更新 Круг обмена ИИ

44.9K 00

OpenAI представляет новую серию моделей вывода, созданных для решения сложных задач. Официально она будет запущена 12 сентября.

Мы разработали ряд новых моделей искусственного интеллекта, которым требуется дополнительное время, чтобы подумать, прежде чем дать ответ. Они могут справляться со сложными задачами и решать более сложные проблемы, чем предыдущие модели, в таких областях, как наука, программирование и математика.

Сегодня мы находимся в ChatGPT и наш API выпустил первую модель из этой серии. Это предварительная версия, и мы планируем регулярно обновлять и улучшать ее. Тем временем мы сделалиРезультаты следующей обновленной оценкиВ настоящее время обновление находится в разработке.

Принцип работы

Мы обучаем эти модели более глубоко обдумывать ответы на вопросы, как это делают люди. В процессе обучения они учатся совершенствовать свои мыслительные процессы, пробовать различные стратегии и признавать свои ошибки.

В наших тестах готовое к запуску обновление модели показало результаты на уровне доктора философии в сложных эталонных задачах по физике, химии и биологии. Мы также обнаружили, что он преуспел в математике и программировании. На отборочном экзамене Международной математической олимпиады (IMO) GPT-4o правильно решил только 13% задач, в то время как новая модель вывода достигла 83%. Что касается способностей к программированию, то в соревнованиях Codeforces они достигли прежнего уровня - 89%. Более подробную информацию можно найти в нашемСтатьи о технических исследованиях.

Будучи ранней моделью, она не имеет многих полезных функций ChatGPT, таких как просмотр веб-страниц и загрузка изображений в файлы. В краткосрочной перспективе для многих распространенных сценариев GPT-4o может оказаться более практичным.

Однако для сложных задач рассуждения - это серьезный прорыв, представляющий собой новый уровень возможностей ИИ. Исходя из этого, мы обнулили счетчик до 1 и назвали серию OpenAI o Security.

Разрабатывая эти новые модели, мы предлагаем новый подход к обучению безопасности, который в полной мере использует их способности к рассуждениям, чтобы обеспечить лучшее соблюдение правил безопасности и согласования. Возможность рассуждать о правилах безопасности в конкретных контекстах позволяет применять их более эффективно.

Одним из способов измерения безопасности является тестирование способности модели продолжать соблюдать правила безопасности при попытке пользователя обойти их (широко известной как "джейлбрейк"). В нашем самом сложном тесте на джейлбрейк GPT-4o набрала 22 балла из 100, а наша модель o1-preview - 84 балла. Более подробную информацию можно найти на сайтеОписание системыи нашИсследовательские статьи.

Чтобы соответствовать новым возможностям этих моделей, мы усилили наши меры безопасности, внутреннее управление и сотрудничество с федеральным правительством. Это включает в себя использование нашихРамки подготовкиПроводим тщательное тестирование и оценку, тестирование "красной командой" высшего уровня, а также процесс проверки на уровне совета директоров, включающий участие нашего Комитета по охране и безопасности.

В подтверждение наших обязательств по обеспечению безопасности ИИ мы недавно заключили официальные соглашения с Институтами безопасности ИИ в США и Великобритании. Мы приступили к реализации этих соглашений, в том числе предоставили этим институтам ранний доступ к исследовательским версиям модели. Это важный первый шаг в нашем партнерстве, который поможет наладить процесс исследования, оценки и тестирования будущих моделей до и после их публичного выпуска.

соответствующее население

Эти расширенные возможности рассуждений особенно подходят для тех, кто работает над сложными проблемами в науке, программировании, математике и других областях. Например, ученые-медики могут использовать o1 для аннотирования данных секвенирования клеток, физики - для создания сложных математических формул, необходимых для квантовой оптики, а разработчики в самых разных областях - для построения и выполнения многоэтапных рабочих процессов.

OpenAI o1-mini

Семейство моделей o1 отлично справляется с генерацией и отладкой сложного кода. Чтобы предоставить разработчикам еще более эффективное решение, мы представили OpenAI o1-mini. Это более быстрая и экономичная модель рассуждений, которая особенно хорошо справляется с задачами программирования. Как модель меньшего масштаба, o1-mini стоит на 80% меньше, чем o1-preview, что делает ее идеальным выбором для приложений, которым требуется мощность рассуждений, но не требуется обширное знание мира, одновременно мощное и доступное.

Как использовать OpenAI o1

Начиная с сегодняшнего дня.Пользователи ChatGPT Plus и TeamМодель o1 может использоваться в ChatGPT. Пользователи могут вручную выбрать o1-preview и o1-mini в селекторе моделей. o1-preview ограничена 30 сообщениями в неделю, а o1-mini - 50 сообщениями в неделю в начальной версии. Мы работаем над увеличением этих ограничений и разработкой возможности для ChatGPT автоматически выбирать наиболее подходящую модель для каждого запроса.

Пользователи ChatGPT Enterprise и Eduполучат доступ к обеим моделям со следующей недели. Познакомьтесь с Уровень использования API 5 (открывается в новом окне) (используется в форме номинального выражения)разработчикиВы можете начать создавать прототипы с использованием обеих моделей в API уже сейчас, при этом текущее ограничение скорости составляет 20 запросов в минуту. Мы проводим дополнительное тестирование с целью увеличения этих ограничений. В настоящее время API для этих моделей не включает такие возможности, как вызов функций, потоковая передача и поддержка системных сообщений. Чтобы начать работу, ознакомьтесь с Документация по API (открывается в новом окне).

Мы также планируем, что все ChatGPT Бесплатные пользователиОба могут использовать o1-mini.

прогноз на будущее

Это лишь раннее представление этих моделей вывода в ChatGPT и API. В дополнение к постоянному обновлению моделей я добавляю просмотр веб-страниц, загрузку файлов и изображений и другие функции, чтобы повысить их полезность.

В дополнение к новому семейству OpenAI o1 мы продолжим разработку и выпуск моделей семейства GPT.

База знаний по искусственному интеллекту

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.