Analytics GBI (XiYan-SQL): интеллектуальная аналитика данных с текста на SQL для ChatBI Made Easy
Общее введение
Analytics GBI - это интеллектуальный продукт для анализа данных на основе больших моделей, созданный компанией Aliyun Bailian. Продукт использует передовую технологию обработки естественного языка, чтобы помочь пользователям запрашивать и анализировать данные с помощью естественного языка без необходимости осваивать сложный синтаксис SQL. Analytics GBI поддерживает различные источники данных, включая базы данных протоколов MySQL, PostgreSQL и файлы Excel, а также предоставляет гибкие возможности развертывания, поддерживающие модели публичного облака и гибридного развертывания. Его мультиинтеллектуальная структура может динамически планировать выполнение задач несколькими интеллектами в зависимости от их сложности, обеспечивая эффективный анализ данных и интеллектуальные функции визуализации диаграмм для повышения эффективности принятия решений пользователями и расширения возможностей понимания данных.
Рекомендуемые продукты с открытым исходным кодом:DB-GPT: создание платформы для разработки приложений для работы с данными на основе искусственного интеллекта, интегрирующей управление несколькими моделями и интеллектуальную обработку данных
XiYan-SQL: многогенераторный интеграционный фреймворк для преобразования текста в SQL
Чтобы решить проблемы производительности больших языковых моделей в задачах преобразования естественного языка в SQL, мы предлагаем XiYan-SQL, инновационный фреймворк, использующий стратегию интеграции нескольких генераторов для улучшения генерации кандидатов. Мы представляем M-Schema, полуструктурированное представление схем для улучшения понимания структур баз данных. Для повышения качества и разнообразия генерируемых SQL-запросов-кандидатов XiYan-SQL объединяет замечательный потенциал контекстного обучения (ICL) с точным контролем контролируемой тонкой настройки. С одной стороны, мы предлагаем ряд обучающих стратегий для тонкой настройки модели с целью генерации высококачественных кандидатов с различными предпочтениями. С другой стороны, мы реализуем метод отбора примеров, основанный на распознавании именованных сущностей, чтобы предотвратить чрезмерный акцент на сущностях в подходах ICL. Улучшитель оптимизирует каждый элемент-кандидат, исправляя логические и синтаксические ошибки. Чтобы решить проблему определения лучших кандидатов, мы настраиваем модель отбора, позволяющую различать тонкие различия в SQL-запросах-кандидатах. Результаты экспериментов на множестве диалектных наборов данных показывают, что XiYan-SQL демонстрирует высокую устойчивость при решении проблем в различных сценариях. В целом, предложенный нами XiYan-SQL достигает конкурентоспособной точности выполнения 89,65% на тестовом наборе Spider, 69,86% на SQL-Eval, 41,20% на NL2GQL и 72,23% на эталоне разработки Bird. Фреймворк не только улучшает качество и разнообразие SQL-запросов, но и превосходит предыдущие подходы.
Источник : https://github.com/XGenerationLab/XiYan-SQL

Список функций
- диалог на естественном языкеЗапрос и анализ данных с помощью естественного языка без необходимости владения синтаксисом SQL.
- Поддержка нескольких источников данных: Поддержка баз данных протоколов MySQL, PostgreSQL и стыковка файлов Excel.
- Интеллектуальное планирование задач: Мультиинтеллектуальная система динамически планирует выполнение задач в зависимости от их сложности.
- Интеллектуальная визуализация диаграммГенерируйте интеллектуальные диаграммы на основе характеристик данных для визуального отображения результатов анализа.
- Объяснение бизнес-логики: Предоставление гибких функций интерпретации бизнес-логики, чтобы помочь большим моделям понять бизнес-сценарии.
- Управление таблицами данных: Управление информацией о таблицах данных для повышения точности запросов.
- Кейсбук Самостоятельная работа: Оптимизация эффективности модели путем руководства самообучением модели через управление случаем.
- Развертывание системы безопасностиПоддержка публичного облака и гибридных моделей развертывания для обеспечения безопасности данных.
Использование помощи
Установка и настройка
- Регистрация и вход: ДоступДиалектика GBI Официальный сайтЗарегистрируйтесь и войдите в свою учетную запись AliCloud.
- Создать проектПосле входа в систему войдите в консоль, нажмите кнопку "Создать проект", заполните название и описание проекта, а также выберите тип источника данных.
- Подключение к источнику данных: В соответствии с выбранным типом источника данных заполните соответствующую информацию о подключении (например, URL-адрес базы данных, имя пользователя, пароль и т. д.), чтобы завершить подключение источника данных.
- Настройка интеллектуальных тел: В настройках проекта настройте стратегию планирования и выполнения задач для интеллектуальных систем и выберите подходящую модель интеллектуального тела.
- Развертывание и тестирование: После завершения настройки нажмите кнопку "Развернуть", и система будет автоматически развернута. После завершения развертывания вы можете протестировать систему через консоль, чтобы убедиться в правильности конфигурации.
Руководство по использованию
- запрос на естественном языке: Введите запрос на естественном языке в поле ввода консоли, например "Запрос данных о продажах за 2023 год", система автоматически сгенерирует SQL и вернет результаты запроса.
- Интеллектуальная генерация диаграмм: На странице результатов запроса нажмите "Создать диаграмму", система автоматически создаст соответствующую диаграмму в соответствии с характеристиками данных, а пользователи могут выбрать различные типы диаграмм для отображения.
- Поддержка многостороннего диалога: Система поддерживает несколько раундов диалога, где пользователи могут добавлять, изменять или повторять вопросы в процессе запроса, а система будет отвечать на них интеллектуально в соответствии с контекстом.
- Объяснение бизнес-логики: В процессе выполнения запроса пользователи могут добавлять пояснения к бизнес-логике, чтобы помочь системе точнее понять смысл запроса.
- Управление библиотекой дел: Пользователи могут добавлять, изменять и управлять случаями в библиотеке случаев, направляя модель через случаи для самообучения и повышения точности и эффективности модели.
- Управление таблицами данных: В модуле "Управление таблицей данных" консоли пользователи могут просматривать и управлять информацией о таблице данных, включая структуру таблицы, информацию о столбцах и т. д., чтобы помочь системе более точно понять проблему запроса.
- Настройки безопасности: В настройках проекта пользователи могут настраивать политики безопасности данных, включая доступ к VPC, шифрование данных и т. д., чтобы гарантировать безопасность передачи и хранения данных.
общие проблемы
- Ошибка подключения к базе данных: Проверьте правильность формата URL, убедитесь, что URL является адресом, доступным для публичной сети, проверьте ограничение IP-адреса доступа к базе данных, убедитесь, что IP-адрес публичной сети Dialect GBI находится в белом списке.
- Плохие результаты запросов: Разделение сложных задач на множество простых задач, добавление представлений таблиц данных и информации о схемах, добавление объяснений бизнес-логики, добавление примеров для оптимизации.
- Ошибка форматирования даты: Рекомендуется использовать формат YYYY-MM-DD и указывать формат даты в описании столбца.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...