はじめに
PandasAIはPythonベースのオープンソースプラットフォームで、自然言語処理技術によってデータ分析プロセスを簡素化するように設計されています。データベース(SQL、CSV、pandas、polars、mongodb、noSQLなど)と会話形式で対話することができます。このプラットフォームは、大規模な言語モデル(GPT-3.5/4、Anthropic、VertexAIなど)とRAG(Retrieval Augmented Generation)技術を利用し、技術的なユーザーとそうでないユーザーの両方にとって、データ分析をより直感的で効率的なものにします。
機能一覧
- 自然言語クエリ自然言語による質問で、データ分析結果に簡単にアクセスできます。
- データの可視化データを視覚化するためにチャートやグラフを作成する。
- データクリーニング欠損値への対処とデータの質の向上。
- フィーチャー・ジェネレーション新しいフィーチャーを生成することで、データセットを強化します。
- 複数データソースのサポートCSV、XLSX、PostgreSQL、MySQL、BigQuery、その他多くのデータソースに接続できます。
- マルチモデル対応GPT 3.5/4、Anthropic、VertexAI、その他の多言語モデルの統合。
ヘルプの使用
設置プロセス
- Dockerのインストール あなたのマシンにDockerがインストールされていることを確認してください。
- クローン倉庫 走る
git clone https://github.com/Sinaptik-AI/pandas-ai
. - プラットフォームの構築 プロジェクト・ディレクトリに移動して
docker-compose build
. - 打ち上げプラットフォーム 走る
docker-compose up
そしてhttp://localhost:3000
.
PandasAIライブラリの使用
- インストーラ ::
- pipを使う:
pip install pandasai
- 詩を使う:
詩の追加 パンダサイ
- pipを使う:
- インポートライブラリ ::
import os
pandas を pd としてインポート
from pandasai import エージェント
- データフレームの作成 ::
sales_by_country = pd.DataFrame({件
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"]、
"収益": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000].
})
- APIキーの設定 ::
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
- エージェントとクエリーの作成 ::
agent = Agent(sales_by_country)
response = agent.chat('売上上位5カ国はどこですか?')
print(response)
- チャートの作成 ::
agent.chat("国のヒストグラムをプロットし、それぞれの国のgdを表示する。各バーに異なる色を使用する。")
PandasAIプラットフォームの使用
- アクセス・プラットフォーム 起業後のアクセス
http://localhost:3000
. - データのアップロード CSVやExcelファイルをアップロードできます。
- 自然言語クエリ 例えば、「売上高上位5カ国は?
- 結果を見る プラットフォームは、適切なチャートを作成するオプションとともに、照会結果を返します。
PandasAIは、ビジネス分析、学術研究、個人プロジェクトなど、様々なデータ分析シナリオに適しています。自然言語処理技術により、ユーザーは複雑なコードを書くことなく、データから価値ある情報を簡単に得ることができます。