Необходимость разработки подсказок при моделировании большого языка

База знаний по искусственному интеллектуОпубликовано 2 года назад Круг обмена ИИ

23.9K 00

Ниже рассматривается основная идея инженерии подсказок и то, как она может улучшить производительность больших языковых моделей (LLM)...

Интерфейс LLM:Одна из ключевых причин популярности больших языковых моделей заключается в том, что их интерфейсы "текст в текст" обеспечивают минимальный опыт работы. В прошлом решение задач с помощью глубокого обучения обычно требовало от нас тонкой настройки хотя бы части данных, чтобы научить модель решать соответствующую задачу. При этом большинство моделей имели экспертную глубину только для конкретных задач. Но теперь, благодаря превосходным возможностям контекстного обучения LLM, мы можем решать самые разные задачи с помощью одной текстовой подсказки. Первоначальный сложный процесс решения задач был абстрагирован языком!

"Инженерия подсказок - это относительно новая дисциплина, которая фокусируется на эффективном использовании языковых моделей для разработки и оптимизации подсказок для различных приложений и исследовательских тем". - Цитируется по [1]

Что такое проект Tip?Простота LLM делает его доступным для большего числа людей. Вам не нужно быть специалистом по изучению данных или инженером машинного обучения, чтобы использовать LLM, достаточно понимать английский (или любой другой язык по вашему выбору), и вы сможете использовать LLM для решения относительно сложных задач! Однако, когда LLM позволяет решать задачи, результаты часто сильно зависят от текстовых подсказок, которые мы даем модели. В результате инженерия подсказок (т.е. метод использования опыта для тестирования различных подсказок с целью оптимизации работы LLM) стала очень популярной и оказала большое влияние, что привело нас к появлению ряда методик и лучших практик.

Как разработать подсказку:Существует множество способов разработки подсказок для LLM. Однако большинство стратегий подсказок имеют несколько общих моментов:

- Входные данные: фактические данные, которые LLM необходимо обработать (например, предложения, которые нужно перевести или классифицировать, документы, которые нужно обобщить, и т. д.).
- Примеры: примеры правильных пар ввода-вывода, которые следует включить в подсказку.
- Инструкция: текстовое описание ожидаемых результатов работы модели.
- Метки (индикаторы): метки или элементы форматирования, которые создают структуру в подсказке.
- Контекст: любая дополнительная информация, предоставленная LLM в подсказке.

В следующей иллюстрации мы приводим пример того, как все вышеперечисленные элементы подсказки могут быть объединены в одну подсказку для категоризации предложения.

Контекстное окно:Во время предварительного обучения LLM видит входные последовательности определенной длины. Во время предварительного обучения мы выбираем эту длину последовательности в качестве "контекстной длины" модели, которая является максимальной длиной последовательности, которую может обработать модель. Если на вход поступает фрагмент текста, длина которого значительно превышает эту заранее заданную длину контекста, модель может отреагировать непредсказуемо и выдать неверные результаты. На практике, однако, существуют методы, такие как саморасширение [2] или позиционная интерполяция [3], которые можно использовать для расширения контекстного окна модели.

В последних исследованиях, посвященных ЛЛМ, особое внимание уделяется созданию длинных контекстных окон, которые позволяют модели обрабатывать больше информации на одну подсказку (например, больше примеров или больше контекста). Однако не все ЛЛМ способны обрабатывать контекстную информацию идеально! Способность ЛЛМ обрабатывать информацию в длинном контекстном окне обычно оценивается с помощью теста "иголка в стоге сена" [4], который.

1. Вставьте случайный факт в контекст.
2. Для обнаружения этого факта требуется модель.
3. Повторите этот тест в различных контекстах, различающихся по длине и расположению фактов в контексте.

Этот тест генерирует изображение, подобное приведенному ниже (источник [4]), на котором мы можем легко заметить проблемы с контекстным окном.

Моя инженерная стратегия:Детали разработки кия зависят от используемой модели. Однако существуют некоторые общие принципы, которыми можно руководствоваться в процессе разработки кия:

- Эмпирический подход: первым шагом в разработке подсказки является создание надежного способа оценки вашей подсказки (например, с помощью тестовых примеров, человеческих оценок или LLM в качестве рубрикатора), чтобы просто измерить модификации подсказки.
- Двигайтесь от простого к сложному: первые попытки использовать подсказки должны быть как можно более простыми, а не пытаться с самого начала использовать сложные цепные подсказки или другие специализированные техники подсказок. Самые первые подсказки должны быть простыми, а затем постепенно усложняйте их, оценивая изменения в результатах работы, чтобы понять, нужно ли усложнять их.
- Будьте как можно более конкретными и прямыми: постарайтесь исключить двусмысленность в заданиях и быть как можно более краткими, прямыми и конкретными в описании ожидаемых результатов.
- Включите примеры: если описать ожидаемый результат сложно, попробуйте включить в подсказку примеры. Примеры дают конкретные примеры ожидаемых результатов и могут устранить двусмысленность.
- По возможности избегайте сложности: сложные стратегии подсказки иногда необходимы (например, для решения многоэтапных задач на рассуждение), но нам нужно дважды подумать, прежде чем использовать такой подход. Используйте эмпирический подход и устоявшиеся стратегии оценки, чтобы понять, нужно ли включать такие сложности.

Подводя итог всему вышесказанному, можно сказать, что моя личная стратегия разработки подсказок заключается в следующем: i) необходимо разработать хорошую систему оценки, ii) начать с простой подсказки и iii) постепенно усложнять ее по мере необходимости, чтобы достичь желаемого уровня эффективности.

Аннотация:

[1] https://promptingguide.ai
[2] https://arxiv.org/abs/2401.01325
[3] https://arxiv.org/abs/2306.15595
[4] https://github.com/gkamradt/LLMTest_NeedleInAHaystack

База знаний по искусственному интеллекту

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.