Google выпускает движок Vertex AI RAG: единое окно для создания надежных генеративных приложений с поддержкой поиска

Новости ИИОпубликовано 7 месяцев назад Круг обмена ИИ
7.3K 00

谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用

Генеративный ИИ и моделирование больших языков (LLM) преобразуют отрасли, но две ключевые проблемы могут сдерживать их внедрение на предприятиях: разочарование (генерация неверной или бессмысленной информации) и ограниченность знаний за пределами обучающих данных. Генерация с расширенным поиском (RAG) и заземление обеспечивают решение проблемы, подключая LLM к внешним источникам данных, что позволяет им получать доступ к актуальной информации и генерировать более аутентичные и релевантные ответы.

В этой статье рассматривается движок Vertex AI RAG и то, как он может помочь разработчикам программного обеспечения и ИИ создавать надежные, основанные на фактах приложения генеративного ИИ.

Что такое RAG и зачем он нужен?

RAG извлекает релевантную информацию из базы знаний и предоставляет ее LLM, позволяя ему генерировать более точные и обоснованные ответы. В отличие от опоры исключительно на предварительно обученные знания LLM, которые могут быть устаревшими или неполными. RAG критически важен для создания приложений генеративного ИИ корпоративного уровня, требующих следующих возможностей:

  • Точность: Сведите к минимуму галлюцинации и убедитесь, что ответы основаны на фактах.
  • Обновление: Получите доступ к самым последним данным и сведениям.
  • Опыт работы в данной области: Использование специализированной базы знаний для конкретных случаев использования.

RAG vs Заземление vs Поиск

  • RAG: Техника поиска релевантной информации и ее предоставления LLM для создания ответа. Эта информация может включать свежие сведения, темы, контекст или фактическую основу.
  • Заземление: Обеспечение надежности и достоверности контента, генерируемого ИИ, путем привязки его к проверенным источникам. В качестве техники привязки может использоваться RAG.
  • Поиск: Метод быстрого поиска и предоставления релевантной информации из источников данных на основе текстовых или мультимодальных запросов, управляемых продвинутыми моделями искусственного интеллекта.

 

Представляем движок Vertex AI RAG Engine

Vertex AI RAG Engine - это размещенная служба оркестровки, которая упрощает сложный процесс поиска необходимой информации и предоставления ее LLM. Это позволяет разработчикам сосредоточиться на создании приложений, а не на управлении инфраструктурой.

谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用

Ключевые преимущества движка Vertex AI RAG:

  • Простота в использовании: Быстрое начало работы с простым API для быстрого создания прототипов и экспериментов.
  • Хореография: Решение проблемы сложности поиска данных и интеграции LLM избавляет разработчиков от необходимости управлять инфраструктурой.
  • Персонализация и поддержка открытых исходных кодов: Выбирайте из множества моделей парсинга, чанкинга, аннотирования, встраивания, хранения векторов и моделей с открытым исходным кодом или создавайте собственные компоненты.
  • Высококачественные компоненты Google: Используйте передовые технологии Google для достижения оптимальной производительности.
  • Гибкость интеграции: Подключайтесь к различным базам данных векторов, таким как Pinecone и Weaviate, или используйте Vertex AI Vector Search.

Vertex AI RAG: ряд решений

Google Cloud предлагает ряд решений RAG и заземления для различных уровней сложности и настройки:

  • Vertex AI Search: Полностью управляемая поисковая система и API ретривера, идеально подходящая для сложных корпоративных сценариев использования, требующих высокого качества, масштабируемости и тонкого контроля доступа. Он упрощает подключение к различным корпоративным источникам данных и поддерживает поиск по нескольким источникам.
  • Полностью DIY RAG: Для разработчиков, которым нужен полный контроль, Vertex AI предоставляет отдельные API-интерфейсы компонентов (например, Text Embedding API, Ranking API, Grounding on Vertex AI) для создания пользовательских конвейеров RAG. Этот подход обеспечивает наибольшую гибкость, но требует значительных усилий по разработке. Используйте этот подход, если вам нужны очень специфические настройки или интеграция с существующим фреймворком RAG.
  • Движок Vertex AI RAG: Он идеально подходит для разработчиков, которые ищут баланс между простотой использования и настройкой. Он позволяет быстро создавать прототипы и разрабатывать их, не жертвуя гибкостью.

Общие случаи использования двигателей RAG в промышленности:

1. финансовые услуги: индивидуальные консультации по инвестициям и оценка рисков:

Проблема: Финансовым консультантам необходимо быстро консолидировать большие объемы информации (включая профили клиентов, рыночные данные, нормативные документы и внутренние исследования), чтобы давать индивидуальные инвестиционные рекомендации и точно оценивать риски. Ручной просмотр всей этой информации отнимает много времени и чреват ошибками.

Решение RAG Engine: Система RAG получает и индексирует соответствующие источники данных. Финансовые консультанты могут запрашивать систему, используя информацию о клиенте и его инвестиционных целях. Система RAG предоставляет краткие, основанные на фактах ответы, извлекая информацию из соответствующих документов, включая цитаты, для поддержки рекомендаций. Это повышает эффективность работы консультантов, снижает риск человеческих ошибок и повышает уровень персонализации рекомендаций. Система также может отмечать потенциальные конфликты интересов или нарушения нормативных требований на основе информации, содержащейся во введенных данных.

2. здравоохранение: ускоренное открытие лекарств и программы персонализированного лечения:

Проблема: Поиск лекарств и персонализированная медицина в значительной степени зависят от анализа больших массивов данных клинических испытаний, научных работ, историй болезни и генетической информации. Анализ этих данных с целью выявления потенциальных мишеней для лекарств, прогнозирования реакции пациента на лечение или составления индивидуального плана лечения является чрезвычайно сложной задачей.

Решение RAG Engine: При соблюдении мер конфиденциальности и безопасности движок RAG может получать и индексировать большие объемы биомедицинской литературы и данных о пациентах. Затем исследователи могут задавать сложные запросы, например "Каковы возможные побочные эффекты препарата X у пациента с генотипом Y?". Система RAG синтезирует релевантную информацию из различных источников, предоставляя исследователям сведения, которые они могли упустить при ручном поиске. Врачам эта система поможет составить индивидуальный план лечения, основанный на уникальных характеристиках и истории болезни пациента и подкрепленный соответствующими исследованиями.

3. юридический отдел: усилить комплексную проверку и анализ контрактов:

Проблема: Специалисты в области права тратят много времени на изучение документов в процессе due diligence, переговоров по контракту и судебных разбирательств. Поиск соответствующих положений, выявление потенциальных рисков и обеспечение соответствия нормативным требованиям отнимает много времени и требует глубоких знаний.

Решение RAG Engine: RAG Engine собирает и индексирует юридические документы, прецедентное право и нормативную информацию. Специалисты по правовым вопросам могут запрашивать систему для поиска конкретных пунктов в договорах, выявления потенциальных правовых рисков и изучения соответствующих прецедентов. Система выделяет несоответствия, потенциальные обязательства и соответствующие прецеденты, что значительно ускоряет процесс проверки и повышает точность. Это помогает ускорить завершение сделок, снизить правовые риски и более эффективно использовать юридические знания.

 

Начало работы с движком Vertex AI RAG Engine

Google предлагает ряд ресурсов, которые помогут вам начать работу, в том числе:

Создание генеративного ИИ, основанного на фактах

Движок RAG компании Vertex AI и ряд решений для обоснования позволяют разработчикам создавать более надежные, достоверные и проницательные приложения генеративного ИИ. Используя эти инструменты, вы сможете раскрыть весь потенциал LLM и преодолеть проблемы разочарования и ограниченности знаний, что откроет путь к более широкому внедрению генеративного ИИ на предприятиях. Выберите решение, которое лучше всего соответствует вашим потребностям, и приступайте к созданию интеллектуальных приложений следующего поколения.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...