Introdução geral
O Analytics GBI é um produto de análise de dados inteligente baseado em grandes modelos lançado pela Aliyun Bailian. O produto usa tecnologia avançada de processamento de linguagem natural para ajudar os usuários a consultar e analisar dados por meio de linguagem natural, sem a necessidade de dominar a complexa sintaxe SQL. O Analytics GBI é compatível com uma variedade de fontes de dados, incluindo MySQL, bancos de dados de protocolo PostgreSQL e arquivos do Excel, e oferece opções de implantação flexíveis que suportam modelos de implantação em nuvem pública e híbrida. Sua estrutura de corpo de várias inteligências pode programar dinamicamente várias inteligências para executar tarefas com base na complexidade da tarefa, fornecendo análise de dados eficiente e funções de visualização de gráficos inteligentes para aprimorar a eficiência da tomada de decisões dos usuários e os recursos de insight de dados.
XiYan-SQL: uma estrutura de integração de vários geradores para texto para SQL
Para enfrentar os desafios de desempenho de grandes modelos de linguagem em linguagem natural para tarefas SQL, propomos o XiYan-SQL, uma estrutura inovadora que emprega uma estratégia de integração de vários geradores para melhorar a geração de candidatos. Apresentamos o M-Schema, uma representação de esquema semiestruturado para melhorar a compreensão das estruturas de banco de dados. Para aprimorar a qualidade e a diversidade das consultas SQL candidatas geradas, o XiYan-SQL combina o notável potencial da aprendizagem contextual (ICL) com o controle preciso do ajuste fino supervisionado. Por um lado, propomos uma série de estratégias de treinamento para o ajuste fino do modelo a fim de gerar candidatos de alta qualidade com diversas preferências. Por outro lado, implementamos um método de seleção de exemplos baseado no reconhecimento de entidades nomeadas para evitar a ênfase excessiva em entidades nas abordagens de ICL. O refinador otimiza cada item candidato corrigindo erros lógicos ou sintáticos. Para enfrentar o desafio de identificar os melhores candidatos, ajustamos um modelo de seleção para distinguir diferenças sutis nas consultas SQL candidatas. Os resultados experimentais em vários conjuntos de dados de dialetos mostram que o XiYan-SQL apresenta grande robustez ao enfrentar os desafios em diferentes cenários. De modo geral, nosso XiYan-SQL proposto alcança uma precisão de execução competitiva de 89,65% no conjunto de teste Spider, 69,86% no SQL-Eval, 41,20% no NL2GQL e pontua 72,23% no benchmark de desenvolvimento Bird. A estrutura não apenas melhora a qualidade e a diversidade das consultas SQL, mas também supera as abordagens anteriores.
Fonte: https://github.com/XGenerationLab/XiYan-SQL
Lista de funções
- diálogo em linguagem naturalConsulta e análise de dados por meio de linguagem natural sem a necessidade de dominar a sintaxe SQL.
- Suporte a várias fontes de dadosSuporte para bancos de dados de protocolo MySQL, PostgreSQL e acoplamento de arquivos do Excel.
- Agendamento inteligente de tarefasEstrutura de corpo multi-inteligente: uma estrutura de corpo multi-inteligente programa dinamicamente a execução de tarefas com base na complexidade da tarefa.
- Visualização inteligente de gráficosGeração de gráficos inteligentes com base nas características dos dados para exibir visualmente os resultados da análise.
- Explicação da lógica comercialFunções de interpretação de lógica comercial flexíveis para ajudar os modelos grandes a entender os cenários comerciais.
- Gerenciamento da tabela de dadosGerencie as informações da tabela de dados para melhorar a precisão da consulta.
- Auto-operação do livro de casosOtimização da eficácia do modelo, orientando a autoaprendizagem do modelo por meio do gerenciamento de casos.
- Implementação de segurançaSuporte à nuvem pública e aos modelos de implantação híbrida para segurança de dados.
Usando a Ajuda
Instalação e configuração
- Registro e login: AcessoSite oficial da Dialectics GBIRegistre-se e faça login com sua conta AliCloud.
- Criar um projetoDepois de fazer login, entre no console, clique em "Create Project" (Criar projeto), preencha o nome e a descrição do projeto e selecione o tipo de fonte de dados.
- Conexão a uma fonte de dadosFonte de dados: De acordo com o tipo de fonte de dados selecionado, preencha as informações de conexão correspondentes (como URL do banco de dados, nome de usuário, senha etc.) para concluir a conexão da fonte de dados.
- Configuração de corpos inteligentesNas configurações do projeto, configure o agendamento de tarefas e a estratégia de execução das inteligências e selecione o modelo de corpo inteligente apropriado.
- Implementação e testeClique em "Deploy" (Implantar) para que o sistema seja implantado automaticamente. Depois que a implementação for concluída, você poderá fazer um teste no console para garantir que a configuração esteja correta.
Diretrizes para uso
- consulta em linguagem naturalDigite uma instrução de consulta em linguagem natural na caixa de entrada do console, como "Query 2023 sales data" (Consultar dados de vendas de 2023), o sistema gerará automaticamente o SQL e retornará os resultados da consulta.
- Geração inteligente de gráficosNa página de resultados da consulta, clique em "Generate Chart" (Gerar gráfico), o sistema gerará automaticamente o gráfico correspondente de acordo com as características dos dados, e os usuários poderão escolher diferentes tipos de gráfico para exibição.
- Apoio ao diálogo em várias rodadasO sistema suporta várias rodadas de diálogo, em que os usuários podem adicionar, modificar ou acompanhar perguntas durante o processo de consulta, e o sistema responderá de forma inteligente de acordo com o contexto.
- Explicação da lógica comercialDurante o processo de consulta, os usuários podem adicionar explicações de lógica comercial para ajudar o sistema a entender a intenção da consulta com mais precisão.
- Gerenciamento da biblioteca de casosOs usuários podem adicionar, modificar e gerenciar casos na biblioteca de casos, orientando o modelo por meio de casos para autoaprendizagem e melhorando a precisão e a eficácia do modelo.
- Gerenciamento da tabela de dadosNo módulo "Data Table Management" (Gerenciamento da tabela de dados) do console, os usuários podem visualizar e gerenciar as informações da tabela de dados, incluindo a estrutura da tabela, as informações da coluna, etc., para ajudar o sistema a entender com mais precisão o problema da consulta.
- Configurações de segurançaNas configurações do projeto, os usuários podem configurar políticas de segurança de dados, incluindo acesso à VPC, criptografia de dados, etc., para garantir a segurança da transmissão e do armazenamento de dados.
problemas comuns
- Erro de conexão com o banco de dadosVerifique se o formato da URL está correto, certifique-se de que a URL é um endereço acessível na rede pública, verifique a restrição de IP de acesso ao banco de dados, certifique-se de que o IP da rede pública do Dialect GBI está na lista de permissões.
- Resultados ruins das consultasProblemas complexos: dividir problemas complexos em vários problemas simples, adicionar representações de tabelas de dados e informações de esquema, adicionar explicações de lógica comercial, adicionar casos para otimização.
- Erro de formatação de dataRecomenda-se usar o formato AAAA-MM-DD e indicar o formato da data na descrição da coluna.