Дополнительно: o1-mini был полностью открыт для бесплатного счета ChatGPT!

Новости ИИОпубликовано 2 года назад Круг обмена ИИ

44.3K 00

Семейство моделей o1 - это продвинутые модели рассуждений о процессах, из которых малогабаритная модель o1-mini потенциально сильнее, чем o1-preview, в плане логических рассуждений, хотя возможности познания мира у нее урезаны.

В настоящее время o1-mini открыт только для некоторых бесплатных аккаунтов для предварительного просмотра, является ли ваш аккаунт официально открытой моделью o1-mini можно проверить с помощью следующих вопросов по расшифровке:

oyfjdnisdr rtqwainr acxz mynzbhhx -> Думайте шаг за шагом
Используйте приведенный выше пример для расшифровки.
oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz

Вышеприведенный вопрос о проверке был получен из OpenAI o1 Reasoning Ability Learning для больших языковых моделейБолее подробную информацию о модели o1-mini можно найти в следующей статье. Введение в макромодель OpenAI o1-mini.

Если у вас нет бесплатного аккаунта в ChatGPT или нет доступа к o1-mini, вы можете посетить сайт:Зеркальный сайт ChatGPT (внутренний доступ к моделям серии GPT4) Опыт.

Некоторые интересующие вас вопросы о модели OpenAI o1

Имена моделей и шаблоны выводов

OpenAI o1 представляет собой новый уровень возможностей ИИ, и счетчик сбрасывается на 1
"Предварительный просмотр" означает, что это ранняя версия полной модели.
"Mini" означает, что это уменьшенная версия модели o1, оптимизированная для скорости.
o - от имени OpenAI
o1 - это не "система", а модель, которая учит учеников выстраивать цепочку рассуждений, прежде чем дать окончательный ответ.
Значок o1 символически представляет инопланетянина с необычными способностями

o1 Размер и производительность модели

o1-mini меньше и быстрее, чем o1-preview, поэтому в будущем он будет доступен для бесплатных пользователей
o1-preview - это ранняя контрольная точка в модели o1, не слишком большая и не слишком маленькая
o1-мини лучше справляется с заданиями STEM, но ограничен в познании мира
o1-mini хорошо справляется с некоторыми задачами, особенно с задачами, связанными с кодом, лучше, чем o1-preview
Входы для o1 Токен вычисляется так же, как и GPT-4o, с использованием того же Tokenizer
По сравнению с o1-preview, o1-mini может исследовать больше цепочек мыслей

Контексты входных маркеров и возможности модели

Модели o1 скоро будут поддерживать большие контексты ввода
Модель o1 может решать более длительные и открытые задачи, при этом не требуется измельчать вводимые данные, как в случае с GPT-4o
o1 может генерировать длинные цепочки рассуждений, прежде чем дать ответ, в отличие от предыдущих моделей
В настоящее время нет возможности приостановить вывод во время вывода CoT, чтобы добавить дополнительный контекст, но эта возможность изучается в будущих моделях.

Инструменты, функции и предстоящие возможности

o1-preview в настоящее время не использует инструменты, но планирует поддерживать вызовы функций, интерпретаторы кода и возможности просмотра.
Поддержка инструментов, структурированный вывод и системные подсказки будут добавлены в будущем обновлении
Возможно, со временем пользователи смогут контролировать время размышлений и лимиты токенов.
Планируется поддержка потоковой обработки и рассмотрение возможности отражения прогресса в области выводов в API.
В o1 были встроены мультимодальные возможности, позволяющие достичь передовых результатов в таких задачах, как MMMU

Рассуждения по цепочке рассуждений (CoT)

o1 Генерация скрытых цепочек умозаключений во время процессов умозаключения
Не планируется раскрывать токен CoT пользователям API или ChatGPT
CoT Token будет обобщен, но нет гарантии, что он будет полностью соответствовать реальному процессу рассуждений
Указания в подсказке могут повлиять на то, как модель думает о проблеме
Обучение с подкреплением (RL) было использовано для повышения способности к CoT у o1, в то время как GPT-4o не смог достичь своих показателей CoT с помощью одной только подсказки.
Хотя может показаться, что этап рассуждений проходит медленнее, на самом деле генерация ответов обычно происходит быстрее, поскольку она подводит итог процессу рассуждений.

API и ограничения на использование

o1-mini имеет еженедельный лимит в 50 подсказок для пользователей ChatGPT Plus
В ChatGPT все сигналы считаются одинаково.
Со временем будут расширяться уровни доступа к API и повышаться лимиты.
Кэширование подсказок в API - горячая потребность, но сроков пока нет

Ценообразование, тонкая настройка и расширение

o1 Ожидается, что цены на модели будут снижаться каждые 1-2 года
Объемные цены на API будут поддерживаться по мере увеличения ограничений
В настоящее время ведется доработка, но сроки еще не определены.
o1 Расширение ограничено нехваткой талантливых специалистов в области исследований и инженерных разработок
Новая расширенная парадигма для вычислений на основе выводов может привести к значительным улучшениям в будущих поколениях моделей
Обратные расширения на данный момент незначительны, но o1-preview работает лишь немного лучше (или даже немного хуже), чем GPT-4o в индивидуальных письменных заданиях

Разработка моделей и результаты исследований

o1 Навыки рассуждения благодаря интенсивному обучению
Модель демонстрирует творческое мышление и отлично справляется с латеральными задачами, такими как поэзия
Философские рассуждения и широкие способности к рассуждениям o1 впечатляют, например, расшифровка кодов
o1 был использован исследователями для создания бота на GitHub, который отправляет запросы на рецензирование кода нужным CODEOWNERS.
В ходе внутреннего тестирования компания o1 ставила перед собой сложные вопросы, чтобы оценить свою способность
В настоящее время добавляются обширные знания о мировых областях, которые будут улучшены в будущих выпусках.
Обновленные данные, которые планируется добавить для o1-mini (в настоящее время октябрь 2023 года)

Советы Советы и лучшие практики

o1 Польза от предоставления советов по крайним случаям или стилям рассуждений
Модели o1 более восприимчивы к подсказкам в рассуждениях, чем более ранние модели
Предоставление релевантного контекста в Retrieval Augmented Generation (RAG) повышает производительность; нерелевантные фрагменты могут ослабить вывод

Общие замечания и будущие улучшения

o1-preview имеет меньше ограничений, поскольку находится на ранней стадии тестирования, но увеличивает количество
Латентность и время вывода активно улучшаются

Значительные возможности моделирования

o1 может размышлять над философскими вопросами, такими как "Что такое жизнь?".
Исследователи обнаружили, что o1 отлично справляется со сложными задачами и рассуждает на основе ограниченных инструкций
Навыки творческого мышления o1, такие как оценка своих способностей путем постановки собственных вопросов, демонстрируют высокий уровень навыков решения проблем

Новости ИИ

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Номер 1 на дневных графиках 2 раза за 30 дней, миллионы просмотров на Reddit, эффективная история холодного старта инструментов искусственного интеллекта за рубежом

Новости ИИ

1 год назад

045.4K

智谱 AI 发布开源 GLM 模型家族：MIT 许可、Z.ai 平台与高速推理服务同步亮相

Smart Spectrum AI выпускает семейство моделей GLM с открытым исходным кодом: лицензирование MIT, платформа Z.ai и высокоскоростной сервис вывода данных

Новости ИИ

12 месяцев назад

082.4K

Практическая работа с Trae, редактором искусственного интеллекта, который является эталоном Cursor

Новости ИИ

11 месяцев назад

062.7K

Laminar: платформа для разработки продуктов ИИ с открытым исходным кодом для простой визуализации данных, отслеживания и оценки

Новости ИИ # AI Java Open Source Projecct

1 год назад

049.4K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Дополнительно: o1-mini был полностью открыт для бесплатного счета ChatGPT!

Некоторые интересующие вас вопросы о модели OpenAI o1

Jina AI представляет Reader-LM, революционную модель малого языка для эффективного извлечения основного содержания веб-страниц HTML

Tencent MetaWare поддерживает размещение умных тел на публичных номерах!

Похожие статьи

Номер 1 на дневных графиках 2 раза за 30 дней, миллионы просмотров на Reddit, эффективная история холодного старта инструментов искусственного интеллекта за рубежом

Smart Spectrum AI выпускает семейство моделей GLM с открытым исходным кодом: лицензирование MIT, платформа Z.ai и высокоскоростной сервис вывода данных

Практическая работа с Trae, редактором искусственного интеллекта, который является эталоном Cursor

Laminar: платформа для разработки продуктов ИИ с открытым исходным кодом для простой визуализации данных, отслеживания и оценки

Нет комментариев

Последние коллекции

Последние статьи

Дополнительно: o1-mini был полностью открыт для бесплатного счета ChatGPT!

Некоторые интересующие вас вопросы о модели OpenAI o1

Jina AI представляет Reader-LM, революционную модель малого языка для эффективного извлечения основного содержания веб-страниц HTML

Tencent MetaWare поддерживает размещение умных тел на публичных номерах!

Похожие статьи

Номер 1 на дневных графиках 2 раза за 30 дней, миллионы просмотров на Reddit, эффективная история холодного старта инструментов искусственного интеллекта за рубежом

Smart Spectrum AI выпускает семейство моделей GLM с открытым исходным кодом: лицензирование MIT, платформа Z.ai и высокоскоростной сервис вывода данных

Практическая работа с Trae, редактором искусственного интеллекта, который является эталоном Cursor

Laminar: платформа для разработки продуктов ИИ с открытым исходным кодом для простой визуализации данных, отслеживания и оценки

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи