AI个人学习
和实操指南

析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

综合介绍

析言GBI是阿里云百炼推出的一款基于大模型的智能数据分析产品。该产品利用先进的自然语言处理技术,帮助用户通过自然语言进行数据查询和分析,无需掌握复杂的SQL语法。析言GBI支持多种数据源,包括MySQL、PostgreSQL协议数据库及Excel文件,并提供灵活的部署方案,支持公共云和混合部署模式。其多智能体框架能够根据任务复杂度动态调度多个智能体执行任务,提供高效的数据分析和智能图表可视化功能,提升用户的决策效率和数据洞察能力。

推荐开源产品:DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

XiYan-SQL: 一个用于文本到 SQL 的多生成器集成框架


为了解决大语言模型在自然语言转 SQL 任务中的性能挑战,我们提出了 XiYan-SQL,这是一种创新框架,采用多生成器集成策略以改进候选生成。我们引入了 M-Schema,一种半结构化的模式表示方法,用于增强对数据库结构的理解。为了提升生成候选 SQL 查询的质量和多样性,XiYan-SQL 将上下文学习(ICL)的显著潜力与监督微调的精确控制相结合。一方面,我们提出了一系列训练策略,用于微调模型以生成具有多样化偏好的高质量候选项。另一方面,我们实现了一种基于命名实体识别的示例选择方法,以防止在 ICL 方法中过度强调实体。精炼器通过纠正逻辑或语法错误优化每个候选项。为了解决识别最佳候选项的挑战,我们微调了一个选择模型,以区分候选 SQL 查询的细微差异。多种方言数据集的实验结果表明,XiYan-SQL 在应对不同场景中的挑战时表现出很强的鲁棒性。总体而言,我们提出的 XiYan-SQL 在 Spider 测试集上的执行准确率达到了 89.65%,在 SQL-Eval 上达到了 69.86%,在 NL2GQL 上达到了 41.20%,在 Bird 开发基准上的得分为 72.23%,具有竞争力的表现。该框架不仅提升了 SQL 查询的质量和多样性,还超越了以往的方法。

来源:https://github.com/XGenerationLab/XiYan-SQL

析言GBI:智能数据分析,轻松实现ChatBI-1

 

功能列表

  • 自然语言对话:通过自然语言进行数据查询和分析,无需掌握SQL语法。
  • 多数据源支持:支持MySQL、PostgreSQL协议数据库及Excel文件对接。
  • 智能任务调度:多智能体框架根据任务复杂度动态调度执行任务。
  • 智能图表可视化:根据数据特征生成智能图表,直观展示分析结果。
  • 业务逻辑解释:提供灵活的业务逻辑解释功能,帮助大模型理解业务场景。
  • 数据表管理:管理数据表信息,提升查询准确性。
  • 案例库自运营:通过案例管理指导模型自学习,优化模型效果。
  • 安全部署:支持公共云和混合部署模式,保障数据安全。

 

使用帮助

安装与配置

  1. 注册与登录:访问析言GBI官网,使用阿里云账号注册并登录。
  2. 创建项目:登录后,进入控制台,点击“创建项目”,填写项目名称和描述,选择数据源类型。
  3. 连接数据源:根据选择的数据源类型,填写相应的连接信息(如数据库URL、用户名、密码等),完成数据源连接。
  4. 配置智能体:在项目设置中,配置智能体的任务调度和执行策略,选择适合的智能体模型。
  5. 部署与测试:完成配置后,点击“部署”,系统将自动进行部署。部署完成后,可以通过控制台进行测试,确保配置正确。

使用指南

  1. 自然语言查询:在控制台输入框中输入自然语言查询语句,如“查询2023年销售数据”,系统将自动生成SQL并返回查询结果。
  2. 智能图表生成:在查询结果页面,点击“生成图表”,系统将根据数据特征自动生成相应的图表,用户可以选择不同的图表类型进行展示。
  3. 多轮对话支持:系统支持多轮对话,用户可以在查询过程中进行补充、修改或追问,系统将根据上下文进行智能应答。
  4. 业务逻辑解释:在查询过程中,用户可以添加业务逻辑解释,帮助系统更准确地理解查询意图。
  5. 案例库管理:用户可以在案例库中添加、修改和管理案例,通过案例指导模型进行自学习,提升模型的准确性和效果。
  6. 数据表管理:在控制台的“数据表管理”模块,用户可以查看和管理数据表信息,包括表结构、列信息等,帮助系统更准确地理解查询问题。
  7. 安全设置:在项目设置中,用户可以配置数据安全策略,包括VPC访问、数据加密等,保障数据传输和存储的安全性。

常见问题

  • 数据库连接错误:检查URL格式是否正确,确保URL为公网可访问地址,检查数据库访问IP限制,确保析言GBI的公网IP在白名单中。
  • 查询效果不佳:将复杂问题拆分为多个简单问题,补充数据表表述和schema信息,增加业务逻辑解释,添加案例进行优化。
  • 日期格式错误:建议使用YYYY-MM-DD格式,并在列描述中注明日期格式。
未经允许不得转载:首席AI分享圈 » 析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文