はじめに
アナリティクスGBIは、アリユン・バイリアンが立ち上げたビッグモデルに基づくインテリジェントなデータ分析製品である。この製品は、高度な自然言語処理技術を使用しており、複雑なSQL構文をマスターすることなく、自然言語によるデータの照会と分析を支援する。Analytics GBIは、MySQL、PostgreSQLプロトコルデータベース、Excelファイルなど、さまざまなデータソースをサポートし、パブリッククラウドやハイブリッド展開モデルをサポートする柔軟な展開オプションを提供する。マルチインテリジェンスボディフレームワークは、タスクの複雑さに応じて複数のインテリジェンスがタスクを実行するように動的にスケジューリングすることができ、効率的なデータ分析とインテリジェントなチャートの視覚化機能を提供することで、ユーザーの意思決定効率とデータ洞察力を高めます。
推奨オープンソース製品:DB-GPT: AIネイティブデータアプリケーション開発フレームワークの構築、マルチモデル管理とインテリジェントデータ処理の統合
XiYan-SQL: テキストからSQLへのマルチジェネレーター統合フレームワーク
自然言語からSQLへの変換タスクにおける大規模な言語モデルの性能課題に対処するため、候補生成の改善を目的としたマルチジェネレータ統合戦略を採用した革新的なフレームワークであるXiYan-SQLを提案する。データベース構造の理解を深めるための半構造化スキーマ表現であるM-Schemaを導入する。生成されるSQLクエリ候補の品質と多様性を向上させるため、XiYan-SQLは、コンテキスト学習(ICL)の顕著な可能性と、教師あり微調整の正確な制御を組み合わせる。一方では、多様な嗜好を持つ高品質の候補を生成するために、モデルを微調整するための一連の学習戦略を提案する。一方では、ICLアプローチにおけるエンティティへの過度の偏重を防ぐために、名前付きエンティティ認識に基づく例選択手法を実装する。リファイナーは、論理的あるいは構文的な誤りを修正することで、各候補項目を最適化する。最良の候補を特定するという課題に対処するため、候補SQLクエリの微妙な違いを区別するための選択モデルを微調整する。複数の方言データセットを用いた実験結果から、XiYan-SQLは様々なシナリオにおける課題に対処する上で強い頑健性を示すことが示された。全体として、我々の提案するXiYan-SQLはSpiderテストセットで89.65%、SQL-Evalで69.86%、NL2GQLで41.20%、Bird開発ベンチマークで72.23%という競争力のある実行精度を達成した。このフレームワークはSQLクエリの品質と多様性を向上させるだけでなく、以前のアプローチを凌駕している。
出典:https://github.com/XGenerationLab/XiYan-SQL
機能一覧
- 自然言語対話SQL構文をマスターすることなく、自然言語を使ってデータを照会・分析。
- 複数データソースのサポートMySQL、PostgreSQLプロトコルのデータベースとExcelファイルのドッキングをサポート。
- インテリジェント・タスク・スケジューリングタスクの複雑性に基づいてタスクの実行を動的にスケジューリングするマルチ知的ボディフレームワーク。
- インテリジェントなチャートの視覚化データ特性に基づいてインテリジェントなチャートを生成し、分析結果を視覚的に表示します。
- ビジネスロジックの説明ビッグモデルがビジネスシナリオを理解するための柔軟なビジネスロジック解釈機能を提供します。
- データテーブル管理データテーブル情報を管理し、クエリの精度を向上させます。
- ケースブック・セルフ・オペレーションケースマネジメントを通じてモデルの自己学習を誘導することで、モデルの有効性を最適化する。
- セキュリティ配備データ・セキュリティのためにパブリック・クラウドとハイブリッド展開モデルをサポートします。
ヘルプの使用
インストールと設定
- 登録とログインアクセス弁証法GBI公式サイトAliCloudアカウントで登録し、ログインします。
- プロジェクトを作成するログイン後、コンソールに入り、"Create Project "をクリックし、プロジェクト名と説明を入力し、データ・ソース・タイプを選択する。
- データソースへの接続選択したデータソースの種類に応じて、対応する接続情報(データベースURL、ユーザー名、パスワードなど)を入力し、データソースの接続を完了します。
- インテリジェント・ボディの設定プロジェクト設定で、インテリジェンスのタスクスケジューリングと実行戦略を設定し、適切なインテリジェント・ボディ・モデルを選択します。
- 配備とテスト設定完了後、"Deploy "をクリックすると、システムが自動的にデプロイされます。デプロイ完了後、コンソールから設定が正しいかテストすることができます。
使用ガイドライン
- 自然言語クエリコンソールの入力ボックスに「2023年の売上データを問い合わせる」のように自然言語で問い合わせ文を入力すると、システムが自動的にSQLを生成し、問い合わせ結果を返します。
- インテリジェントなチャート生成クエリ結果のページで "Generate Chart "をクリックすると、システムはデータの特徴に応じて対応するチャートを自動的に生成します。
- 多ラウンド対話支援このシステムは複数回の対話をサポートしており、ユーザーは問い合わせの過程で質問を追加、修正、またはフォローアップすることができます。
- ビジネスロジックの説明クエリプロセス中に、ユーザーはビジネスロジックの説明を追加して、システムがクエリの意図をより正確に理解できるようにすることができます。
- ケースライブラリーの管理ユーザーは、ケース・ライブラリーのケースを追加、修正、管理することができ、ケースを通じてモデルを自己学習させ、モデルの精度と有効性を向上させることができます。
- データテーブル管理コンソールの "データテーブル管理 "モジュールでは、テーブル構造やカラム情報などのデータテーブル情報を閲覧・管理することができます。
- セキュリティ設定プロジェクト設定では、VPCアクセス、データ暗号化などのデータセキュリティポリシーを設定し、データ送信と保存のセキュリティを保証することができます。
一般的な問題
- データベース接続エラーURLの形式が正しいかどうか、URLがパブリックネットワークにアクセス可能なアドレスであるかどうか、データベースへのアクセスIP制限をチェックし、Dialectic GBIのパブリックネットワークIPがホワイトリストに入っているかどうかを確認します。
- 問い合わせ結果が悪い複雑な問題を複数の単純な問題に分割し、データテーブルの表現とスキーマ情報を追加し、ビジネスロジックの説明を追加し、最適化のためのケースを追加する。
- 日付書式エラーYYYY-MM-DD形式を使用し、列の説明に日付形式を示すことを推奨する。