Analytics GBI (XiYan-SQL): интеллектуальная аналитика данных с текста на SQL для ChatBI Made Easy

Общее введение

Analytics GBI - это интеллектуальный продукт для анализа данных на основе больших моделей, созданный компанией Aliyun Bailian. Продукт использует передовую технологию обработки естественного языка, чтобы помочь пользователям запрашивать и анализировать данные с помощью естественного языка без необходимости осваивать сложный синтаксис SQL. Analytics GBI поддерживает различные источники данных, включая базы данных протоколов MySQL, PostgreSQL и файлы Excel, а также предоставляет гибкие возможности развертывания, поддерживающие модели публичного облака и гибридного развертывания. Его мультиинтеллектуальная структура может динамически планировать выполнение задач несколькими интеллектами в зависимости от их сложности, обеспечивая эффективный анализ данных и интеллектуальные функции визуализации диаграмм для повышения эффективности принятия решений пользователями и расширения возможностей понимания данных.

Рекомендуемые продукты с открытым исходным кодом:DB-GPT: создание платформы для разработки приложений для работы с данными на основе искусственного интеллекта, интегрирующей управление несколькими моделями и интеллектуальную обработку данных

XiYan-SQL: многогенераторный интеграционный фреймворк для преобразования текста в SQL

Чтобы решить проблемы производительности больших языковых моделей в задачах преобразования естественного языка в SQL, мы предлагаем XiYan-SQL, инновационный фреймворк, использующий стратегию интеграции нескольких генераторов для улучшения генерации кандидатов. Мы представляем M-Schema, полуструктурированное представление схем для улучшения понимания структур баз данных. Для повышения качества и разнообразия генерируемых SQL-запросов-кандидатов XiYan-SQL объединяет замечательный потенциал контекстного обучения (ICL) с точным контролем контролируемой тонкой настройки. С одной стороны, мы предлагаем ряд обучающих стратегий для тонкой настройки модели с целью генерации высококачественных кандидатов с различными предпочтениями. С другой стороны, мы реализуем метод отбора примеров, основанный на распознавании именованных сущностей, чтобы предотвратить чрезмерный акцент на сущностях в подходах ICL. Улучшитель оптимизирует каждый элемент-кандидат, исправляя логические и синтаксические ошибки. Чтобы решить проблему определения лучших кандидатов, мы настраиваем модель отбора, позволяющую различать тонкие различия в SQL-запросах-кандидатах. Результаты экспериментов на множестве диалектных наборов данных показывают, что XiYan-SQL демонстрирует высокую устойчивость при решении проблем в различных сценариях. В целом, предложенный нами XiYan-SQL достигает конкурентоспособной точности выполнения 89,65% на тестовом наборе Spider, 69,86% на SQL-Eval, 41,20% на NL2GQL и 72,23% на эталоне разработки Bird. Фреймворк не только улучшает качество и разнообразие SQL-запросов, но и превосходит предыдущие подходы.

Источник : https://github.com/XGenerationLab/XiYan-SQL

析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

 

Список функций

  • диалог на естественном языкеЗапрос и анализ данных с помощью естественного языка без необходимости владения синтаксисом SQL.
  • Поддержка нескольких источников данных: Поддержка баз данных протоколов MySQL, PostgreSQL и стыковка файлов Excel.
  • Интеллектуальное планирование задач: Мультиинтеллектуальная система динамически планирует выполнение задач в зависимости от их сложности.
  • Интеллектуальная визуализация диаграммГенерируйте интеллектуальные диаграммы на основе характеристик данных для визуального отображения результатов анализа.
  • Объяснение бизнес-логики: Предоставление гибких функций интерпретации бизнес-логики, чтобы помочь большим моделям понять бизнес-сценарии.
  • Управление таблицами данных: Управление информацией о таблицах данных для повышения точности запросов.
  • Кейсбук Самостоятельная работа: Оптимизация эффективности модели путем руководства самообучением модели через управление случаем.
  • Развертывание системы безопасностиПоддержка публичного облака и гибридных моделей развертывания для обеспечения безопасности данных.

 

Использование помощи

Установка и настройка

  1. Регистрация и вход: ДоступДиалектика GBI Официальный сайтЗарегистрируйтесь и войдите в свою учетную запись AliCloud.
  2. Создать проектПосле входа в систему войдите в консоль, нажмите кнопку "Создать проект", заполните название и описание проекта, а также выберите тип источника данных.
  3. Подключение к источнику данных: В соответствии с выбранным типом источника данных заполните соответствующую информацию о подключении (например, URL-адрес базы данных, имя пользователя, пароль и т. д.), чтобы завершить подключение источника данных.
  4. Настройка интеллектуальных тел: В настройках проекта настройте стратегию планирования и выполнения задач для интеллектуальных систем и выберите подходящую модель интеллектуального тела.
  5. Развертывание и тестирование: После завершения настройки нажмите кнопку "Развернуть", и система будет автоматически развернута. После завершения развертывания вы можете протестировать систему через консоль, чтобы убедиться в правильности конфигурации.

Руководство по использованию

  1. запрос на естественном языке: Введите запрос на естественном языке в поле ввода консоли, например "Запрос данных о продажах за 2023 год", система автоматически сгенерирует SQL и вернет результаты запроса.
  2. Интеллектуальная генерация диаграмм: На странице результатов запроса нажмите "Создать диаграмму", система автоматически создаст соответствующую диаграмму в соответствии с характеристиками данных, а пользователи могут выбрать различные типы диаграмм для отображения.
  3. Поддержка многостороннего диалога: Система поддерживает несколько раундов диалога, где пользователи могут добавлять, изменять или повторять вопросы в процессе запроса, а система будет отвечать на них интеллектуально в соответствии с контекстом.
  4. Объяснение бизнес-логики: В процессе выполнения запроса пользователи могут добавлять пояснения к бизнес-логике, чтобы помочь системе точнее понять смысл запроса.
  5. Управление библиотекой дел: Пользователи могут добавлять, изменять и управлять случаями в библиотеке случаев, направляя модель через случаи для самообучения и повышения точности и эффективности модели.
  6. Управление таблицами данных: В модуле "Управление таблицей данных" консоли пользователи могут просматривать и управлять информацией о таблице данных, включая структуру таблицы, информацию о столбцах и т. д., чтобы помочь системе более точно понять проблему запроса.
  7. Настройки безопасности: В настройках проекта пользователи могут настраивать политики безопасности данных, включая доступ к VPC, шифрование данных и т. д., чтобы гарантировать безопасность передачи и хранения данных.

общие проблемы

  • Ошибка подключения к базе данных: Проверьте правильность формата URL, убедитесь, что URL является адресом, доступным для публичной сети, проверьте ограничение IP-адреса доступа к базе данных, убедитесь, что IP-адрес публичной сети Dialect GBI находится в белом списке.
  • Плохие результаты запросов: Разделение сложных задач на множество простых задач, добавление представлений таблиц данных и информации о схемах, добавление объяснений бизнес-логики, добавление примеров для оптимизации.
  • Ошибка форматирования даты: Рекомендуется использовать формат YYYY-MM-DD и указывать формат даты в описании столбца.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...