RAG: расширение поиска

База знаний по искусственному интеллектуОпубликовано 2 года назад Круг обмена ИИ

71.4K 00

RAG (Retrieve Augmented Generation) - это метод оптимизации вывода больших языковых моделей (LLM) на основе информации из авторитетных баз знаний. Эта техника повышает качество вывода и обеспечивает его релевантность, точность и полезность в различных контекстах за счет расширения функциональности LLM для обращения к внутренней базе знаний конкретной области или организации при генерации ответов.

Оптимизация больших языковых моделей (LLM)

Большие языковые модели (LLM) обычно обучаются на больших наборах данных с миллиардами параметров, чтобы генерировать исходные данные для таких задач, как ответы на вопросы, перевод языка и завершение предложений. Однако тот факт, что обучающие данные для LLM статичны и имеют конечную дату обновления знаний, приводит к тому, что модели могут предоставлять неверную информацию при отсутствии ответов или выдавать устаревшие или неоднозначные ответы при ответе на запрос, требующий доступа к конкретной актуальной информации. Кроме того, существует вероятность того, что ответы LLM могут быть получены из неавторитетных источников или выдавать неверные ответы из-за терминологической путаницы, т. е. один и тот же термин может относиться к разному содержанию в разных источниках данных.

Решение RAG

RAG решает эту проблему, направляя LLM на извлечение релевантной информации из заранее определенных, авторитетных источников знаний. Базовая модель обычно обучается в автономном режиме и не имеет доступа к данным, полученным после завершения обучения. LLM обычно обучаются на очень общих доменных корпорациях, поэтому они менее эффективны при обработке специфических задач. Модель RAG способна извлекать информацию из данных, отличных от данных базовой модели, и дополнять подсказки, добавляя соответствующие извлеченные данные в контекст.

Для получения дополнительной информации об архитектуре модели RAG см.Генерация задач НЛП, требующих больших знаний, с помощью поиска..

Преимущества дополненного поколения (RAG)

С помощью RAG можно получать данные из различных внешних источников (например, хранилищ документов, баз данных или API) для дополнения подсказок. Процесс начинается с преобразования документов и пользовательских запросов в формат, совместимый с релевантным поиском. Совместимость форматов в данном контексте означает, что нам необходимо использовать модель языка встраивания для преобразования коллекции документов (которую можно рассматривать как базу знаний) и запроса пользователя в числовое представление для сравнения и поиска. Основной задачей модели RAG является сравнение встраивания запроса пользователя с векторами в базе знаний.

Усовершенствованные подсказки затем отправляются в базовую модель, где исходные подсказки пользователя объединяются с соответствующим контекстом из похожих документов в базе знаний. Вы также можете асинхронно обновлять базу знаний и связанные с ней встроенные представления, чтобы еще больше повысить эффективность и точность модели RAG.

Задачи, стоящие перед RAG

Несмотря на то, что RAG предоставляет возможность оптимизировать большие языковые модели для тщательного решения задач информационного поиска и ответов на вопросы на практике, он все еще сталкивается с рядом проблем и трудностей.

1. точность и надежность источников данных

В моделях генерации дополнений к поиску точность и обновление источника данных имеют решающее значение. Если источник данных содержит неверную, устаревшую или непроверенную информацию, это может привести к неправильным или некачественным ответам, генерируемым RAG. Поэтому обеспечение качества источников данных - это задача, которую необходимо решать постоянно.

2. эффективность поиска

Хотя RAG может эффективно работать с большими массивами данных, при увеличении базы знаний или усложнении запроса могут возникнуть проблемы с эффективностью. Поскольку поиск релевантной информации в большом объеме данных - задача, требующая много времени и вычислений, оптимизация эффективности алгоритма поиска также является проблемой для RAG.

3. способность к обобщению

Модели RAG могут быть особенно чувствительны к конкретным данным и запросам, а некоторые проблемы могут показаться более сложными для принятия разумных и эффективных стратегий, что часто требует моделей с хорошими возможностями обобщения. Вопросы и проблемы, которые необходимо решить при обучении моделей работе с различными запросами и источниками данных, довольно сложны.

4. обработка гетерогенных данных

На практике данные не всегда существуют в виде документов, но могут быть и в других формах, таких как изображения, аудио и видео. Задача RAG работать с такими формами данных для поиска и перекрестных ссылок между более широким спектром источников знаний также является сложной.

Для решения вышеперечисленных проблем необходимо найти баланс между мощностью RAG и его потенциальными проблемами, чтобы гарантировать его производительность в различных реальных приложениях.

Для получения подробной информации см. следующий пример блокнота:

Важная ссылка: https://docs.aws.amazon.com/pdfs/sagemaker/latest/dg/sagemaker-dg.pdf#jumpstart-foundation-models-customize-rag

Генерация с расширением поиска: вопросы и ответы на основе специализированных наборов данных

Генерация улучшений поиска: вопросы и ответы для пользовательских наборов данных на основе библиотеки LangChain с открытым исходным кодом

База знаний по искусственному интеллекту

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.