Дополнительно: o1-mini был полностью открыт для бесплатного счета ChatGPT!

Семейство моделей o1 - это продвинутые модели рассуждений о процессах, из которых малогабаритная модель o1-mini потенциально сильнее, чем o1-preview, в плане логических рассуждений, хотя возможности познания мира у нее урезаны.
В настоящее время o1-mini открыт только для некоторых бесплатных аккаунтов для предварительного просмотра, является ли ваш аккаунт официально открытой моделью o1-mini можно проверить с помощью следующих вопросов по расшифровке:
oyfjdnisdr rtqwainr acxz mynzbhhx -> Думайте шаг за шагом
Используйте приведенный выше пример для расшифровки.
oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz
Вышеприведенный вопрос о проверке был получен из OpenAI o1 Reasoning Ability Learning для больших языковых моделейБолее подробную информацию о модели o1-mini можно найти в следующей статье. Введение в макромодель OpenAI o1-mini.
Если у вас нет бесплатного аккаунта в ChatGPT или нет доступа к o1-mini, вы можете посетить сайт:Зеркальный сайт ChatGPT (внутренний доступ к моделям серии GPT4) Опыт.
Некоторые интересующие вас вопросы о модели OpenAI o1
Имена моделей и шаблоны выводов
- OpenAI o1 представляет собой новый уровень возможностей ИИ, и счетчик сбрасывается на 1
- "Предварительный просмотр" означает, что это ранняя версия полной модели.
- "Mini" означает, что это уменьшенная версия модели o1, оптимизированная для скорости.
- o - от имени OpenAI
- o1 - это не "система", а модель, которая учит учеников выстраивать цепочку рассуждений, прежде чем дать окончательный ответ.
- Значок o1 символически представляет инопланетянина с необычными способностями
o1 Размер и производительность модели
- o1-mini меньше и быстрее, чем o1-preview, поэтому в будущем он будет доступен для бесплатных пользователей
- o1-preview - это ранняя контрольная точка в модели o1, не слишком большая и не слишком маленькая
- o1-мини лучше справляется с заданиями STEM, но ограничен в познании мира
- o1-mini хорошо справляется с некоторыми задачами, особенно с задачами, связанными с кодом, лучше, чем o1-preview
- Входы для o1 Токен вычисляется так же, как и GPT-4o, с использованием того же Tokenizer
- По сравнению с o1-preview, o1-mini может исследовать больше цепочек мыслей
Контексты входных маркеров и возможности модели
- Модели o1 скоро будут поддерживать большие контексты ввода
- Модель o1 может решать более длительные и открытые задачи, при этом не требуется измельчать вводимые данные, как в случае с GPT-4o
- o1 может генерировать длинные цепочки рассуждений, прежде чем дать ответ, в отличие от предыдущих моделей
- В настоящее время нет возможности приостановить вывод во время вывода CoT, чтобы добавить дополнительный контекст, но эта возможность изучается в будущих моделях.
Инструменты, функции и предстоящие возможности
- o1-preview в настоящее время не использует инструменты, но планирует поддерживать вызовы функций, интерпретаторы кода и возможности просмотра.
- Поддержка инструментов, структурированный вывод и системные подсказки будут добавлены в будущем обновлении
- Возможно, со временем пользователи смогут контролировать время размышлений и лимиты токенов.
- Планируется поддержка потоковой обработки и рассмотрение возможности отражения прогресса в области выводов в API.
- В o1 были встроены мультимодальные возможности, позволяющие достичь передовых результатов в таких задачах, как MMMU
Рассуждения по цепочке рассуждений (CoT)
- o1 Генерация скрытых цепочек умозаключений во время процессов умозаключения
- Не планируется раскрывать токен CoT пользователям API или ChatGPT
- CoT Token будет обобщен, но нет гарантии, что он будет полностью соответствовать реальному процессу рассуждений
- Указания в подсказке могут повлиять на то, как модель думает о проблеме
- Обучение с подкреплением (RL) было использовано для повышения способности к CoT у o1, в то время как GPT-4o не смог достичь своих показателей CoT с помощью одной только подсказки.
- Хотя может показаться, что этап рассуждений проходит медленнее, на самом деле генерация ответов обычно происходит быстрее, поскольку она подводит итог процессу рассуждений.
API и ограничения на использование
- o1-mini имеет еженедельный лимит в 50 подсказок для пользователей ChatGPT Plus
- В ChatGPT все сигналы считаются одинаково.
- Со временем будут расширяться уровни доступа к API и повышаться лимиты.
- Кэширование подсказок в API - горячая потребность, но сроков пока нет
Ценообразование, тонкая настройка и расширение
- o1 Ожидается, что цены на модели будут снижаться каждые 1-2 года
- Объемные цены на API будут поддерживаться по мере увеличения ограничений
- В настоящее время ведется доработка, но сроки еще не определены.
- o1 Расширение ограничено нехваткой талантливых специалистов в области исследований и инженерных разработок
- Новая расширенная парадигма для вычислений на основе выводов может привести к значительным улучшениям в будущих поколениях моделей
- Обратные расширения на данный момент незначительны, но o1-preview работает лишь немного лучше (или даже немного хуже), чем GPT-4o в индивидуальных письменных заданиях
Разработка моделей и результаты исследований
- o1 Навыки рассуждения благодаря интенсивному обучению
- Модель демонстрирует творческое мышление и отлично справляется с латеральными задачами, такими как поэзия
- Философские рассуждения и широкие способности к рассуждениям o1 впечатляют, например, расшифровка кодов
- o1 был использован исследователями для создания бота на GitHub, который отправляет запросы на рецензирование кода нужным CODEOWNERS.
- В ходе внутреннего тестирования компания o1 ставила перед собой сложные вопросы, чтобы оценить свою способность
- В настоящее время добавляются обширные знания о мировых областях, которые будут улучшены в будущих выпусках.
- Обновленные данные, которые планируется добавить для o1-mini (в настоящее время октябрь 2023 года)
Советы Советы и лучшие практики
- o1 Польза от предоставления советов по крайним случаям или стилям рассуждений
- Модели o1 более восприимчивы к подсказкам в рассуждениях, чем более ранние модели
- Предоставление релевантного контекста в Retrieval Augmented Generation (RAG) повышает производительность; нерелевантные фрагменты могут ослабить вывод
Общие замечания и будущие улучшения
- o1-preview имеет меньше ограничений, поскольку находится на ранней стадии тестирования, но увеличивает количество
- Латентность и время вывода активно улучшаются
Значительные возможности моделирования
- o1 может размышлять над философскими вопросами, такими как "Что такое жизнь?".
- Исследователи обнаружили, что o1 отлично справляется со сложными задачами и рассуждает на основе ограниченных инструкций
- Навыки творческого мышления o1, такие как оценка своих способностей путем постановки собственных вопросов, демонстрируют высокий уровень навыков решения проблем
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...