Analytics GBI (XiYan-SQL): Análisis inteligente de datos de texto a SQL para ChatBI simplificado
Últimos recursos sobre IAActualizado hace 7 meses Círculo de intercambio de inteligencia artificial 2.2K 00
Introducción general
Analytics GBI es un producto de análisis inteligente de datos basado en big models lanzado por Aliyun Bailian. El producto utiliza tecnología avanzada de procesamiento del lenguaje natural para ayudar a los usuarios a consultar y analizar datos a través del lenguaje natural sin tener que dominar la compleja sintaxis SQL. Analytics GBI admite diversas fuentes de datos, como MySQL, bases de datos de protocolo PostgreSQL y archivos Excel, y ofrece opciones de despliegue flexibles compatibles con modelos de nube pública y despliegue híbrido. Su marco de trabajo multiinteligencia puede programar dinámicamente múltiples inteligencias para realizar tareas basadas en la complejidad de la tarea, proporcionando un análisis de datos eficiente y funciones de visualización de gráficos inteligentes para mejorar la eficiencia de la toma de decisiones de los usuarios y las capacidades de conocimiento de datos.
Productos de código abierto recomendados:DB-GPT: Creación de un marco de desarrollo de aplicaciones de datos nativas de IA que integra la gestión multimodelo y el procesamiento inteligente de datos
XiYan-SQL: un marco de integración multigenerador de texto a SQL
Para abordar los retos de rendimiento de los grandes modelos lingüísticos en tareas de conversión de lenguaje natural a SQL, proponemos XiYan-SQL, un marco innovador que emplea una estrategia de integración multigenerador para mejorar la generación de candidatos. Introducimos M-Schema, una representación de esquemas semiestructurada para mejorar la comprensión de las estructuras de bases de datos. Para mejorar la calidad y diversidad de las consultas SQL candidatas generadas, XiYan-SQL combina el notable potencial del aprendizaje contextual (ICL) con el control preciso del ajuste fino supervisado. Por un lado, proponemos una serie de estrategias de entrenamiento para afinar el modelo y generar candidatos de alta calidad con preferencias diversas. Por otro, aplicamos un método de selección de ejemplos basado en el reconocimiento de entidades con nombre para evitar el énfasis excesivo en las entidades en los enfoques ICL. El refinador optimiza cada elemento candidato corrigiendo errores lógicos o sintácticos. Para afrontar el reto de identificar los mejores candidatos, afinamos un modelo de selección para distinguir diferencias sutiles en las consultas SQL candidatas. Los resultados experimentales en múltiples conjuntos de datos dialectales demuestran que XiYan-SQL muestra una gran solidez a la hora de abordar los retos en diferentes escenarios. En general, nuestra propuesta XiYan-SQL alcanza una precisión de ejecución competitiva de 89,65% en el conjunto de pruebas Spider, 69,86% en SQL-Eval, 41,20% en NL2GQL, y obtiene 72,23% en el punto de referencia de desarrollo Bird. El marco no sólo mejora la calidad y la diversidad de las consultas SQL, sino que también supera a los enfoques anteriores.
Fuente : https://github.com/XGenerationLab/XiYan-SQL

Lista de funciones
- diálogo en lenguaje natural: Consulta y análisis de datos mediante lenguaje natural sin necesidad de dominar la sintaxis SQL.
- Compatibilidad con múltiples fuentes de datos: Soporte para bases de datos MySQL, protocolo PostgreSQL y acoplamiento de archivos Excel.
- Programación inteligente de tareas: Un marco para organismos multiinteligentes programa dinámicamente la ejecución de tareas en función de su complejidad.
- Visualización inteligente de gráficosGeneración de gráficos inteligentes basados en las características de los datos para mostrar visualmente los resultados de los análisis.
- Explicación de la lógica empresarialFunciones flexibles de interpretación de la lógica empresarial para ayudar a los grandes modelos a comprender los escenarios empresariales.
- Gestión de tablas de datos: Gestiona la información de las tablas de datos para mejorar la precisión de las consultas.
- Cuaderno de autoayuda: Optimizar la eficacia de los modelos guiando su autoaprendizaje mediante la gestión de casos.
- Despliegue de seguridadSeguridad de los datos: admite modelos de despliegue híbridos y de nube pública para la seguridad de los datos.
Utilizar la ayuda
Instalación y configuración
- Registro e inicio de sesión: AccesoWeb oficial de Dialectics GBIRegístrate e inicia sesión con tu cuenta de AliCloud.
- Crear un proyectoTras iniciar sesión, entre en la consola, haga clic en "Crear proyecto", rellene el nombre y la descripción del proyecto y seleccione el tipo de fuente de datos.
- Conexión a una fuente de datosSegún el tipo de fuente de datos seleccionado, rellene la información de conexión correspondiente (como la URL de la base de datos, el nombre de usuario, la contraseña, etc.) para completar la conexión de la fuente de datos.
- Configuración de cuerpos inteligentesEn los ajustes del proyecto, configure la programación de tareas y la estrategia de ejecución de las inteligencias y seleccione el modelo de cuerpo inteligente adecuado.
- Despliegue y pruebasDespliegue: Una vez completada la configuración, haga clic en "Desplegar", el sistema se desplegará automáticamente. Una vez completado el despliegue, puede realizar una prueba a través de la consola para asegurarse de que la configuración es correcta.
Normas de uso
- consulta en lenguaje naturalConsulta en lenguaje natural: Introduzca una consulta en lenguaje natural en el cuadro de entrada de la consola, por ejemplo "Consultar datos de ventas de 2023", el sistema generará automáticamente el SQL y devolverá los resultados de la consulta.
- Generación inteligente de gráficosEn la página de resultados de la consulta, haga clic en "Generar gráfico". El sistema generará automáticamente el gráfico correspondiente en función de las características de los datos, y los usuarios podrán elegir distintos tipos de gráfico para su visualización.
- Apoyo al diálogo en varias rondasEl sistema admite múltiples rondas de diálogo, en las que los usuarios pueden añadir, modificar o seguir preguntas durante el proceso de consulta, y el sistema responderá de forma inteligente en función del contexto.
- Explicación de la lógica empresarialDurante el proceso de consulta, los usuarios pueden añadir explicaciones de lógica de negocio para ayudar al sistema a entender la intención de la consulta con mayor precisión.
- Gestión de la biblioteca de casosLos usuarios pueden añadir, modificar y gestionar casos en la biblioteca de casos, guiando al modelo a través de casos para el autoaprendizaje y mejorando la precisión y eficacia del modelo.
- Gestión de tablas de datosEn el módulo "Gestión de tablas de datos" de la consola, los usuarios pueden ver y gestionar la información de las tablas de datos, incluida la estructura de la tabla, la información de las columnas, etc., para ayudar al sistema a comprender con mayor precisión el problema de la consulta.
- Ajustes de seguridadEn los ajustes del proyecto, los usuarios pueden configurar las políticas de seguridad de los datos, incluido el acceso a la VPC, el cifrado de datos, etc., para garantizar la seguridad de la transmisión y el almacenamiento de datos.
problemas comunes
- Error de conexión a la base de datosCompruebe si el formato de la URL es correcto, asegúrese de que la URL es una dirección de red pública accesible, compruebe la restricción de IP de acceso a la base de datos, asegúrese de que la IP de red pública de Dialectic GBI está en la lista blanca.
- Malos resultados de las consultasDividir problemas complejos en múltiples problemas sencillos, añadir representaciones de tablas de datos e información de esquemas, añadir explicaciones de lógica empresarial, añadir casos para la optimización.
- Error de formato de fechaSe recomienda utilizar el formato AAAA-MM-DD e indicar el formato de fecha en la descripción de la columna.
© declaración de copyright
El artículo está protegido por derechos de autor y no debe reproducirse sin autorización.
Artículos relacionados
Sin comentarios...