Научно-популярное: Что такое контекстное окно большой языковой модели

База знаний по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

32.9K 00

Контекстное окно большой модели - это ключевое понятие, которое влияет на способность модели обрабатывать и генерировать текст. Размер контекстного окна определяет общее количество входных и выходных лексем, которые модель может рассмотреть за одно взаимодействие.

Определение контекстного окна

Контекстное окно - это максимальное количество лексем (токенов), которое может быть учтено Большой языковой моделью (LLM) при обработке входного текста и одновременной генерации выходного текста. Токеном может быть слово, фраза или знак препинания. Размер контекстного окна напрямую влияет на глубину понимания моделью входной информации и связность генерируемого контента.

Маркеры входа и выхода

маркер ввода: Весь текстовый контент, предоставляемый модели пользователем, включая вопросы, инструкции и т.д.
выходной маркер: Ответы или результаты, генерируемые моделью.

В любой момент времени общее количество входных и выходных лексем не может превышать максимальную длину контекстного окна. Например, максимальное контекстное окно для модели GPT-3.5-turbo составляет 4096 токенов, что означает, что сумма пользовательского ввода и вывода модели не может превысить этот предел.

Входные и выходные ограничения распространенных макромоделей

Различные большие языковые модели имеют разные ограничения на контекстное окно. Вот некоторые распространенные модели и их ограничения:

GPT-3.5: Максимальное контекстное окно составляет 4096 токенов.
GPT-4: Поддерживаются контекстные окна большего размера, конкретные значения которых зависят от версии, обычно от 8000 до 32000 токенов.
Близнецы 1.5: Максимальное контекстное окно до 1 миллиона токенов.
КИМИ(большие бытовые модели): до 2 миллионов маркеров.

Эти ограничения влияют не только на способность модели обрабатывать информацию, но и на качество и согласованность генерируемого контента.

Анализ конкретных примеров

Предположим, что мы используем GPT-3.5 для решения задачи, в которой ему необходимо кратко изложить содержание книги. В книге около 100 000 слов, а GPT-3.5 может обрабатывать только 4096 лексем. Если мы разобьем содержание книги на несколько сегментов, каждый из которых будет содержать не более 4096 лексем, то нам нужно будет взаимодействовать с моделью пошагово, вводя по одному фрагменту содержания и запрашивая резюме. Это позволит модели обрабатывать всю книгу, но добавит сложности, поскольку при каждом вызове необходимо будет обеспечивать согласованность между предыдущим и последующим текстом.

Примерные сценарии

пользовательский ввод: Пожалуйста, помогите мне кратко изложить первую главу книги (предполагается, что глава состоит из 3000 знаков).
выход модели: Это краткое изложение главы 1 (при условии, что было сгенерировано 500 маркеров).
Пользователь продолжает вводить: Далее кратко изложите содержание главы 2 (снова 3000 знаков).

В этом случае пользователю необходимо учитывать, что предыдущая информация может быть забыта после каждого взаимодействия, поскольку общий объем ввода и вывода не может превышать 4096 лексем. Если пользователь обратится к информации из первой главы в последующем запросе, который находится вне контекстного окна, модель не сможет ответить точно, что повлияет на согласованность диалога.

резюме

Понимание контекстного окна Большой модели и ее ограничений на ввод и вывод очень важно для эффективного использования этих методов. Разумное использование этих ограничений поможет разработчикам создавать более эффективные и согласованные приложения, а также повысит удобство работы с ними. В будущем, по мере развития технологий, мы можем ожидать увеличения контекстных окон, что позволит большим языковым моделям обрабатывать более сложную и длинную информацию.

База знаний по искусственному интеллекту

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.