Дополнительно: o1-mini был полностью открыт для бесплатного счета ChatGPT!

Новости ИИОпубликовано 11 месяцев назад Круг обмена ИИ
6.7K 00
号外:o1-mini已全面开放给ChatGPT免费账户体验

 

Семейство моделей o1 - это продвинутые модели рассуждений о процессах, из которых малогабаритная модель o1-mini потенциально сильнее, чем o1-preview, в плане логических рассуждений, хотя возможности познания мира у нее урезаны.

В настоящее время o1-mini открыт только для некоторых бесплатных аккаунтов для предварительного просмотра, является ли ваш аккаунт официально открытой моделью o1-mini можно проверить с помощью следующих вопросов по расшифровке:

oyfjdnisdr rtqwainr acxz mynzbhhx -> Думайте шаг за шагом

Используйте приведенный выше пример для расшифровки.

oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz

Вышеприведенный вопрос о проверке был получен из OpenAI o1 Reasoning Ability Learning для больших языковых моделейБолее подробную информацию о модели o1-mini можно найти в следующей статье. Введение в макромодель OpenAI o1-mini.

 

Если у вас нет бесплатного аккаунта в ChatGPT или нет доступа к o1-mini, вы можете посетить сайт:Зеркальный сайт ChatGPT (внутренний доступ к моделям серии GPT4) Опыт.

 

 

Некоторые интересующие вас вопросы о модели OpenAI o1

 

Имена моделей и шаблоны выводов

  • OpenAI o1 представляет собой новый уровень возможностей ИИ, и счетчик сбрасывается на 1
  • "Предварительный просмотр" означает, что это ранняя версия полной модели.
  • "Mini" означает, что это уменьшенная версия модели o1, оптимизированная для скорости.
  • o - от имени OpenAI
  • o1 - это не "система", а модель, которая учит учеников выстраивать цепочку рассуждений, прежде чем дать окончательный ответ.
  • Значок o1 символически представляет инопланетянина с необычными способностями

 

o1 Размер и производительность модели

  • o1-mini меньше и быстрее, чем o1-preview, поэтому в будущем он будет доступен для бесплатных пользователей
  • o1-preview - это ранняя контрольная точка в модели o1, не слишком большая и не слишком маленькая
  • o1-мини лучше справляется с заданиями STEM, но ограничен в познании мира
  • o1-mini хорошо справляется с некоторыми задачами, особенно с задачами, связанными с кодом, лучше, чем o1-preview
  • Входы для o1 Токен вычисляется так же, как и GPT-4o, с использованием того же Tokenizer
  • По сравнению с o1-preview, o1-mini может исследовать больше цепочек мыслей

 

Контексты входных маркеров и возможности модели

  • Модели o1 скоро будут поддерживать большие контексты ввода
  • Модель o1 может решать более длительные и открытые задачи, при этом не требуется измельчать вводимые данные, как в случае с GPT-4o
  • o1 может генерировать длинные цепочки рассуждений, прежде чем дать ответ, в отличие от предыдущих моделей
  • В настоящее время нет возможности приостановить вывод во время вывода CoT, чтобы добавить дополнительный контекст, но эта возможность изучается в будущих моделях.

 

Инструменты, функции и предстоящие возможности

  • o1-preview в настоящее время не использует инструменты, но планирует поддерживать вызовы функций, интерпретаторы кода и возможности просмотра.
  • Поддержка инструментов, структурированный вывод и системные подсказки будут добавлены в будущем обновлении
  • Возможно, со временем пользователи смогут контролировать время размышлений и лимиты токенов.
  • Планируется поддержка потоковой обработки и рассмотрение возможности отражения прогресса в области выводов в API.
  • В o1 были встроены мультимодальные возможности, позволяющие достичь передовых результатов в таких задачах, как MMMU

 

Рассуждения по цепочке рассуждений (CoT)

  • o1 Генерация скрытых цепочек умозаключений во время процессов умозаключения
  • Не планируется раскрывать токен CoT пользователям API или ChatGPT
  • CoT Token будет обобщен, но нет гарантии, что он будет полностью соответствовать реальному процессу рассуждений
  • Указания в подсказке могут повлиять на то, как модель думает о проблеме
  • Обучение с подкреплением (RL) было использовано для повышения способности к CoT у o1, в то время как GPT-4o не смог достичь своих показателей CoT с помощью одной только подсказки.
  • Хотя может показаться, что этап рассуждений проходит медленнее, на самом деле генерация ответов обычно происходит быстрее, поскольку она подводит итог процессу рассуждений.

 

API и ограничения на использование

  • o1-mini имеет еженедельный лимит в 50 подсказок для пользователей ChatGPT Plus
  • В ChatGPT все сигналы считаются одинаково.
  • Со временем будут расширяться уровни доступа к API и повышаться лимиты.
  • Кэширование подсказок в API - горячая потребность, но сроков пока нет

 

Ценообразование, тонкая настройка и расширение

  • o1 Ожидается, что цены на модели будут снижаться каждые 1-2 года
  • Объемные цены на API будут поддерживаться по мере увеличения ограничений
  • В настоящее время ведется доработка, но сроки еще не определены.
  • o1 Расширение ограничено нехваткой талантливых специалистов в области исследований и инженерных разработок
  • Новая расширенная парадигма для вычислений на основе выводов может привести к значительным улучшениям в будущих поколениях моделей
  • Обратные расширения на данный момент незначительны, но o1-preview работает лишь немного лучше (или даже немного хуже), чем GPT-4o в индивидуальных письменных заданиях

 

Разработка моделей и результаты исследований

  • o1 Навыки рассуждения благодаря интенсивному обучению
  • Модель демонстрирует творческое мышление и отлично справляется с латеральными задачами, такими как поэзия
  • Философские рассуждения и широкие способности к рассуждениям o1 впечатляют, например, расшифровка кодов
  • o1 был использован исследователями для создания бота на GitHub, который отправляет запросы на рецензирование кода нужным CODEOWNERS.
  • В ходе внутреннего тестирования компания o1 ставила перед собой сложные вопросы, чтобы оценить свою способность
  • В настоящее время добавляются обширные знания о мировых областях, которые будут улучшены в будущих выпусках.
  • Обновленные данные, которые планируется добавить для o1-mini (в настоящее время октябрь 2023 года)

 

Советы Советы и лучшие практики

  • o1 Польза от предоставления советов по крайним случаям или стилям рассуждений
  • Модели o1 более восприимчивы к подсказкам в рассуждениях, чем более ранние модели
  • Предоставление релевантного контекста в Retrieval Augmented Generation (RAG) повышает производительность; нерелевантные фрагменты могут ослабить вывод

 

Общие замечания и будущие улучшения

  • o1-preview имеет меньше ограничений, поскольку находится на ранней стадии тестирования, но увеличивает количество
  • Латентность и время вывода активно улучшаются

 

Значительные возможности моделирования

  • o1 может размышлять над философскими вопросами, такими как "Что такое жизнь?".
  • Исследователи обнаружили, что o1 отлично справляется со сложными задачами и рассуждает на основе ограниченных инструкций
  • Навыки творческого мышления o1, такие как оценка своих способностей путем постановки собственных вопросов, демонстрируют высокий уровень навыков решения проблем
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...