o1 - это не модель чата, обучающая вас, как правильно мотивировать возможности o1

Новости ИИОпубликовано 1 год назад Круг обмена ИИ

45.6K 00

Как правильно написать o1: не пишите подсказки, пишите краткие изложения, сосредоточьтесь на целях: опишите, чего вы хотите добиться.ничегоНе то, что вы хотите.каким образомПолучите его и знайте о плюсах и минусах o1!

С момента выхода o1 в октябре и анонса o1 pro/o3 в декабре многие люди пытались разобраться в своем восприятии, как положительном, так и отрицательном. Мы заняли позитивную позицию в момент спада настроений по поводу o1 Pro и рассказали о том, что может потребоваться OpenAI для запуска прокси-продукта стоимостью 2 000 долларов в месяц (по слухам, это произойдет в ближайшие несколько недель). С тех пор o1 был на всех LMArena В чартах он уверенно держится на первом месте.

С тех пор он запустил Dawn Analytics и продолжает публиковать нефильтрованные мысли об o1 - сначала как громкий скептик, а затем как повседневный пользователь. Нам нравятся различные значения людей, которые меняют свое мнение, и мы думаем, что такой же диалог происходит по всему миру, когда люди пытаются перейти от режима чата к новому миру рассуждений и сотен долларов в месяц за профессиональные продукты ИИ, теперь GA))). Вот наши мысли.

Как я прошел путь от ненависти к o1 до использования его каждый день для решения своих самых важных проблем?

Я научился им пользоваться.

Когда вышел o1 pro, я без колебаний подписался на него.Чтобы оправдать цену в 200 долларов в месяц, необходимо обеспечить всего 1-2 часа работы инженера в месяц.

Но в конце концов, пытаясь заставить модель работать, я пришел к выводу, чтоЭто чушь..

Каждый раз, когда я задаю вопрос, мне приходится ждать 5 минут, а в ответ я получаю кучу противоречивой белиберды с непрошенными архитектурными схемами + список плюсов и минусов.

o1 Отвечая на мой вопрос, вы многократно противоречите сами себе.

Конечно, люди часто очень фанатично относятся к OpenAI после релиза (что является второй лучшей стратегией для вирусного распространения, после негативных отзывов).

Но здесь все по-другому - эти представления исходят от людей, оказавшихся в трудной ситуации.

Чем больше я начинал общаться с людьми, которые не соглашались со мной, тем больше понимал, что был совершенно неправ:

Я использую o1 как модель чата - но o1 не является моделью чата.

Как правильно использовать o1

Если o1 не является моделью чата, то что же это такое?

Я думаю о нем как о "генераторе отчетов". Если дать ему достаточно контекста и рассказать, что нужно вывести, он обычно решает проблему раз и навсегда.

Примечание от swyx: OpenAI опубликовал предложение по подсказкам o1, но мы считаем его неполным, и в каком-то смысле вы можете считать эту статью "недостающим руководством" для практического опыта работы с o1 и o1 pro на практике.

1. Не пишите подсказки, пишите краткие изложения

Предоставьте много контекста. Что бы вы ни думали, что я имею в виду под словом "много", умножьте это на 10.

Когда вы используете такое приложение, как Клод При моделировании таких чатов, как 3.5 Sonnet или 4o, вы обычно начинаете с простого вопроса и некоторого контекста. Если модели нужно больше контекста, она обычно попросит вас об этом (или это будет очевидно из результатов).

Вы итерационно возвращаетесь к модели, корректируя ее и расширяя требования, пока не получите желаемый результат. Это почти как гончарное дело.Модель чата, по сути, извлекает из вас контекст с помощью этого обмена сообщениями.. Со временем наши задачи стали быстрее + ленивее - настолько ленивее, насколько это возможно, но при этом с хорошим результатом.

o1 будет воспринимать только ленивые вопросы буквально и не будет пытаться выудить из вас контекст. Вместо этого вам нужноПередайте как можно больше контекста в o1.

Даже если вы задаете простой инженерный вопрос:

Объясните все способы, которые вы пробовали и которые не сработали.
Добавьте полный дамп всех схем базы данных
Объясните, чем занимается ваша компания и насколько она велика (и определите специфические для компании термины)

Короче говоря, относитесь к o1 как к новому сотруднику. Обратите внимание, что ошибки в *o1 включают рассуждения о том, сколько он должен рассуждать. *Иногда дисперсия не может точно соотнестись со сложностью задачи. Например, если задача очень, очень легкая, он обычно спускается в кроличью нору рассуждений без видимых причин.Примечание: API o1 позволяет указать низкий/средний/высокий уровень reasoning_effort, но ChatGPT Недоступно для пользователей.

Упростите для o1 получение контекстных подсказок

Я предлагаю использовать ваш mac/телефон на Приложение "Голосовые заметкиЯ просто описываю все проблемное пространство в течение 1-2 минут, а затем вставляю этот текст. Я просто описываю все проблемное пространство в течение 1-2 минут, а затем вставляю этот текст.
- У меня есть блокнот, в котором я сохраняю длинные фрагменты контекста для повторного использования.
- swyx: Я использую Sarav's Careless в LS Discord. Шепот
ИИ-помощники, появляющиеся внутри продукта, часто могут облегчить процесс извлечения. Например, если вы используете Supabase, попробуйте попросить Supabase Assistant сделать дамп/описать все соответствующие таблицы/RPC и т. д.

swyx: Я бы изменил начало на "Тратьте в 10 раз больше времени на подсказки".

2. Сосредоточьтесь на цели: опишите, чего вы хотитеничегоНе то, что вы хотите.каким образомПолучите его.

После того как вы наполнили модель как можно большим количеством контекста -Сосредоточьтесь на объяснении того, что вы хотите получить в результате.

Для большинства моделей мы привыкли говорить модели, что мы хотим, чтобы онакаким образомОтветьте нам. Например, "Вы - профессиональный инженер-программист. Думайте медленно и тщательно".

Это противоположно тому, что я нашел o1 успешным. Я не тренирую его.каким образомДелайте - только инструктируйтеничего. Затем позвольте o1 взять на себя ответственность и спланировать и решить свои собственные шаги. Это и есть цель автономного рассуждения, и на самом деле это может быть намного быстрее, чем если бы вы вручную просматривали и общались в чате как "человек в петле".

Плохая попытка иллюстрации Свикса

Это требует, чтобы выТочно знайте, чего вы хотите.(И вы действительно должны просить конкретный вывод в каждом запросе - его можно обдумать только в самом начале!)

Звучит проще, чем есть на самом деле! Хочу ли я, чтобы o1 внедрил конкретную архитектуру в производство, создал минимальное тестовое приложение или просто изучил варианты и перечислил плюсы и минусы? Это совершенно разные требования.

o1 обычно объясняет понятия по умолчанию, используя синтаксис в стиле отчета - полностью пронумерованные заголовки и подзаголовки. Если вы хотите пропустить объяснение и вывести полный документ, вам нужно просто явно указать это.

Профессиональные советы от swyx: Установление действительно хороших критериев для "хорошего" и "плохого" поможет вамДайте модели возможность самостоятельно оценивать свои результаты и улучшать/исправлять свои ошибки.

В качестве дополнительного преимущества, это в конечном итоге даст вам LLM в качестве инструмента оценки, который вы можете использовать для интенсивной тонкой настройки во время GA.

С тех пор как я научился использовать o1, я был потрясен его способностью генерировать правильный ответ с первого раза. Он действительно лучше почти во всех отношениях (кроме стоимости/замедления).

Вот несколько моментов, которые особенно выделяются:

3. Понимание преимуществ и недостатков o1

o1 Преимущества:

Идеально подходит для создания целых/многих файлов одновременно: Пока что это самая впечатляющая возможность o1. Я копирую/вставляю много кода и много контекста о том, что я создаю, и он генерирует весь файл (или несколько файлов!) за один проход полностью ), обычно без ошибок и следуя существующим шаблонам в моей кодовой базе.
Меньше галлюцинаций: В целом, кажется, что он меньше путает вещи. Например, o1 очень хорош в настройке языков запросов (например, ClickHouse и New Relic), в то время как Claude часто путает синтаксис Postgres.
**МЕДИЦИНСКИЙ ДИАГНОЗ:** Моя подруга - дерматолог, поэтому всякий раз, когда у кого-то из друзей или членов моей расширенной семьи возникают проблемы с кожей, они присылают ей фотографию! Чтобы развлечься, я начал одновременно задавать вопрос o1. Обычно он довольно близок к правильному ответу - примерно в 3/5 случаев. Более полезен для медицинских работников -Почти всегда это позволяет провести чрезвычайно точную дифференциальную диагностику.
**Объяснение концепций:** Мне показалось, что он очень хорошо объясняет очень сложные инженерные концепции на примерах. Это почти как генерировать целую статью. Когда мне приходится принимать сложные архитектурные решения, я часто прошу o1 сгенерировать несколько планов, каждый из которых имеет свои плюсы/минусы, и даже сравниваю эти планы. Я копирую/вставляю ответы в PDF-файл и сравниваю их - почти как при рассмотрении предложений.
**Награда: оценка. **Я всегда скептически относился к использованию LLM в качестве жюри для оценки, потому что, по сути, модели жюри обычно сталкиваются с теми же режимами отказа, что и модель, которая изначально сгенерировала вывод. Тем не менее, o1 показывает большие перспективы - он обычно способен судить о правильности или неправильности генерации в очень небольшом контексте.

Недостатки o1 (на данный момент):

**Пишу в определенном голосе/стиле:** Нет, я не использовал o1 для этого поста 🙂 .
Я считаю, что у него очень плохо получается писать о чем-либо, особенно в том, что касается определенного голоса или стиля. У него очень академический/корпоративный стиль репортажей, которому он хочет следовать. Мне кажется, там просто много рассуждений. Токен Настройте тон в этом направлении, и от него будет трудно избавиться.
Вот пример того, как я пытаюсь заставить его написать эту статью - это после долгих переговоров - он просто пытается выдать безвкусный школьный отчет.

Создайте все приложение:o1 очень хорошо справляется с генерацией целых файлов за один раз. Тем не менее, несмотря на некоторые оптимистичные ...... демо-версии, которые вы можете увидеть в Twitter, o1 не будет создавать для вас SaaS целиком, по крайней мере, не послевеликодушныйитераций. Но этовозможно** Создавайте почти все функции сразу, особенно фронтенд или простые бэкенд-функции..

Новости ИИ

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Загадочная модель генерации изображений красной панды (Red Panda) возглавила арену! Больше, чем FLUX 1.1Pro

Новости ИИ

1 год назад

033.8K

Google выпускает Gemini 2.5: значительные улучшения в возможностях "мышления"

Новости ИИ

1 год назад

053.2K

Выход Adobe Premiere Pro 25.2: искусственный интеллект - новая волна видеомонтажа

Новости ИИ

12 месяцев назад

053.6K

Сэм Альтман: OpenAI подтверждает выпуск агентов искусственного интеллекта для повышения эффективности работы предприятий

Новости ИИ

1 год назад

046K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

o1 - это не модель чата, обучающая вас, как правильно мотивировать возможности o1

Как правильно использовать o1

1. Не пишите подсказки, пишите краткие изложения

2. Сосредоточьтесь на цели: опишите, чего вы хотитеничегоНе то, что вы хотите.каким образомПолучите его.

3. Понимание преимуществ и недостатков o1

450 для обучения 'o1-preview'? Калифорнийский университет в Беркли выложил в открытый доступ 32-битную модель вывода Sky-T1, ИИ-сообщество в восторге

Чунцинский университет полностью перешел на онлайн-консультации с эксклюзивным ИИ-консультантом, которым воспользовались более 10 000 студентов

Похожие статьи

Загадочная модель генерации изображений красной панды (Red Panda) возглавила арену! Больше, чем FLUX 1.1Pro

Google выпускает Gemini 2.5: значительные улучшения в возможностях "мышления"

Выход Adobe Premiere Pro 25.2: искусственный интеллект - новая волна видеомонтажа

Сэм Альтман: OpenAI подтверждает выпуск агентов искусственного интеллекта для повышения эффективности работы предприятий

Нет комментариев

Последние коллекции

Последние статьи

o1 - это не модель чата, обучающая вас, как правильно мотивировать возможности o1

Как правильно использовать o1

1. Не пишите подсказки, пишите краткие изложения

2. Сосредоточьтесь на цели: опишите, чего вы хотитеничегоНе то, что вы хотите.каким образомПолучите его.

3. Понимание преимуществ и недостатков o1

450 для обучения 'o1-preview'? Калифорнийский университет в Беркли выложил в открытый доступ 32-битную модель вывода Sky-T1, ИИ-сообщество в восторге

Чунцинский университет полностью перешел на онлайн-консультации с эксклюзивным ИИ-консультантом, которым воспользовались более 10 000 студентов

Похожие статьи

Загадочная модель генерации изображений красной панды (Red Panda) возглавила арену! Больше, чем FLUX 1.1Pro

Google выпускает Gemini 2.5: значительные улучшения в возможностях "мышления"

Выход Adobe Premiere Pro 25.2: искусственный интеллект - новая волна видеомонтажа

Сэм Альтман: OpenAI подтверждает выпуск агентов искусственного интеллекта для повышения эффективности работы предприятий

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи