PandasAI : une plateforme de dialogue pour l'analyse de données et la génération de graphiques en langage naturel

Introduction générale

PandasAI est une plateforme open source basée sur Python conçue pour simplifier le processus d'analyse des données grâce à des techniques de traitement du langage naturel. Elle permet aux utilisateurs d'interagir avec des bases de données (par exemple SQL, CSV, pandas, polars, mongodb, noSQL, etc.) de manière conversationnelle. La plateforme utilise des modèles de langage à grande échelle (par exemple GPT-3.5/4, Anthropic, VertexAI) et des technologies RAG (Retrieval Augmented Generation) pour rendre l'analyse des données plus intuitive et plus efficace pour les utilisateurs techniques et non techniques.

PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

 

PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

 

Liste des fonctions

  • requête en langage naturelLes résultats de l'analyse des données sont facilement accessibles par le biais d'une interrogation en langage naturel.
  • Visualisation des donnéesLes données peuvent être visualisées à l'aide de diagrammes et de graphiques.
  • Nettoyage des donnéesLes données manquantes : traitement des valeurs manquantes et amélioration de la qualité des données.
  • Génération de fonctionnalitésAméliorer l'ensemble de données en générant de nouvelles caractéristiques.
  • Prise en charge de plusieurs sources de donnéesLes sources de données : se connecter à CSV, XLSX, PostgreSQL, MySQL, BigQuery et bien d'autres sources de données.
  • Prise en charge de plusieurs modèlesIntégration de GPT 3.5/4, Anthropic, VertexAI et d'autres modèles multilingues.

 

Utiliser l'aide

Processus d'installation

  1. Installation de Docker Pour ce faire, vous devez vous assurer que Docker est installé sur votre machine.
  2. entrepôt de clones : Rungit clone https://github.com/Sinaptik-AI/pandas-ai.
  3. Construire des plates-formes : Allez dans le répertoire du projet et exécutezdocker-compose build.
  4. Plate-forme de lancement : Rundocker-compose upet visiter ensuitehttp://localhost:3000.

Utilisation de la bibliothèque PandasAI

  1. installateur : :
    • Utiliser pip :pip install pandasai
    • Utilisez la POÉSIE :poetry add pandasai
  2. bibliothèque d'importation : :
import os
import pandas as pd
from pandasai import Agent
  1. Création de cadres de données : :
sales_by_country = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
  1. Configuration de la clé API : :
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
  1. Création d'un agent et d'une requête : :
agent = Agent(sales_by_country)
response = agent.chat('Which are the top 5 countries by sales?')
print(response)
  1. Générer des graphiques : :
agent.chat("Plot the histogram of countries showing for each one the gd. Use different colors for each bar")

Utiliser la plateforme PandasAI

  1. Plateformes d'accès Accès après le démarragehttp://localhost:3000.
  2. Télécharger les données Les fichiers CSV ou Excel peuvent être téléchargés par l'intermédiaire de l'interface.
  3. requête en langage naturel : Saisissez une question dans le champ d'interrogation, par exemple "Quels sont les 5 premiers pays en termes de chiffre d'affaires ?
  4. Voir les résultats La plate-forme renverra les résultats de l'enquête avec la possibilité de générer les graphiques appropriés.

PandasAI convient à une grande variété de scénarios d'analyse de données, qu'il s'agisse d'analyse commerciale, de recherche universitaire ou de projets personnels. Grâce à la technologie de traitement du langage naturel, les utilisateurs peuvent facilement obtenir des informations précieuses à partir des données sans écrire de code complexe.

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...