PandasAI : une plateforme de dialogue pour l'analyse de données et la génération de graphiques en langage naturel
Introduction générale
PandasAI est une plateforme open source basée sur Python conçue pour simplifier le processus d'analyse des données grâce à des techniques de traitement du langage naturel. Elle permet aux utilisateurs d'interagir avec des bases de données (par exemple SQL, CSV, pandas, polars, mongodb, noSQL, etc.) de manière conversationnelle. La plateforme utilise des modèles de langage à grande échelle (par exemple GPT-3.5/4, Anthropic, VertexAI) et des technologies RAG (Retrieval Augmented Generation) pour rendre l'analyse des données plus intuitive et plus efficace pour les utilisateurs techniques et non techniques.


Liste des fonctions
- requête en langage naturelLes résultats de l'analyse des données sont facilement accessibles par le biais d'une interrogation en langage naturel.
- Visualisation des donnéesLes données peuvent être visualisées à l'aide de diagrammes et de graphiques.
- Nettoyage des donnéesLes données manquantes : traitement des valeurs manquantes et amélioration de la qualité des données.
- Génération de fonctionnalitésAméliorer l'ensemble de données en générant de nouvelles caractéristiques.
- Prise en charge de plusieurs sources de donnéesLes sources de données : se connecter à CSV, XLSX, PostgreSQL, MySQL, BigQuery et bien d'autres sources de données.
- Prise en charge de plusieurs modèlesIntégration de GPT 3.5/4, Anthropic, VertexAI et d'autres modèles multilingues.
Utiliser l'aide
Processus d'installation
- Installation de Docker Pour ce faire, vous devez vous assurer que Docker est installé sur votre machine.
- entrepôt de clones : Run
git clone https://github.com/Sinaptik-AI/pandas-ai
. - Construire des plates-formes : Allez dans le répertoire du projet et exécutez
docker-compose build
. - Plate-forme de lancement : Run
docker-compose up
et visiter ensuitehttp://localhost:3000
.
Utilisation de la bibliothèque PandasAI
- installateur : :
- Utiliser pip :
pip install pandasai
- Utilisez la POÉSIE :
poetry add pandasai
- Utiliser pip :
- bibliothèque d'importation : :
import os
import pandas as pd
from pandasai import Agent
- Création de cadres de données : :
sales_by_country = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
- Configuration de la clé API : :
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
- Création d'un agent et d'une requête : :
agent = Agent(sales_by_country)
response = agent.chat('Which are the top 5 countries by sales?')
print(response)
- Générer des graphiques : :
agent.chat("Plot the histogram of countries showing for each one the gd. Use different colors for each bar")
Utiliser la plateforme PandasAI
- Plateformes d'accès Accès après le démarrage
http://localhost:3000
. - Télécharger les données Les fichiers CSV ou Excel peuvent être téléchargés par l'intermédiaire de l'interface.
- requête en langage naturel : Saisissez une question dans le champ d'interrogation, par exemple "Quels sont les 5 premiers pays en termes de chiffre d'affaires ?
- Voir les résultats La plate-forme renverra les résultats de l'enquête avec la possibilité de générer les graphiques appropriés.
PandasAI convient à une grande variété de scénarios d'analyse de données, qu'il s'agisse d'analyse commerciale, de recherche universitaire ou de projets personnels. Grâce à la technologie de traitement du langage naturel, les utilisateurs peuvent facilement obtenir des informations précieuses à partir des données sans écrire de code complexe.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...