Allgemeine Einführung
PandasAI ist eine auf Python basierende Open-Source-Plattform, die den Prozess der Datenanalyse durch Techniken der natürlichen Sprachverarbeitung vereinfachen soll. Sie ermöglicht es Nutzern, mit Datenbanken (z.B. SQL, CSV, Pandas, Polars, Mongodb, NoSQL, etc.) in einer konversationellen Weise zu interagieren. Die Plattform nutzt umfangreiche Sprachmodelle (z.B. GPT-3.5/4, Anthropic, VertexAI) und Retrieval Augmented Generation (RAG) Technologien, um die Datenanalyse sowohl für technische als auch für nicht-technische Benutzer intuitiver und effizienter zu gestalten.
Funktionsliste
- Abfrage in natürlicher SpracheEinfacher Zugang zu Datenanalyseergebnissen durch Fragen in natürlicher Sprache.
- Visualisierung der DatenErstellen von Diagrammen und Schaubildern zur Visualisierung von Daten.
- DatenbereinigungUmgang mit fehlenden Werten und Verbesserung der Datenqualität.
- Feature-GenerierungVerbessern Sie den Datensatz, indem Sie neue Merkmale erzeugen.
- Unterstützung mehrerer DatenquellenVerbindung zu CSV, XLSX, PostgreSQL, MySQL, BigQuery und vielen anderen Datenquellen.
- Unterstützung mehrerer ModelleIntegration von GPT 3.5/4, Anthropic, VertexAI und anderen mehrsprachigen Modellen.
Hilfe verwenden
Einbauverfahren
- Installation von Docker Vergewissern Sie sich, dass Sie Docker auf Ihrem Rechner installiert haben.
- Klon-Lager : Lauf
git clone https://github.com/Sinaptik-AI/pandas-ai
. - Plattformen bauen : Wechseln Sie in das Projektverzeichnis und führen Sie
docker-compose build
. - Plattform starten : Lauf
docker-compose up
und besuchen Sie dannhttp://localhost:3000
.
Verwendung der PandasAI-Bibliothek
- Installateur ::
- Verwenden Sie pip:
pip install pandasai
- Verwenden Sie POETRY:
poetry add pandasai
- Verwenden Sie pip:
- Importbibliothek ::
import os
import pandas as pd
from pandasai import Agent
- Erstellen von Datenframes ::
sales_by_country = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
- Konfigurieren des API-Schlüssels ::
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
- Agent und Abfrage erstellen ::
agent = Agent(sales_by_country)
response = agent.chat('Which are the top 5 countries by sales?')
print(response)
- Diagramme generieren ::
agent.chat("Plot the histogram of countries showing for each one the gd. Use different colors for each bar")
Verwendung der PandasAI-Plattform
- Zugangsplattformen Zugang nach der Inbetriebnahme
http://localhost:3000
. - Daten hochladen Hochladen von CSV- oder Excel-Dateien über die Schnittstelle.
- Abfrage in natürlicher Sprache Geben Sie eine Frage in das Abfragefeld ein, z. B. "Welches sind die 5 umsatzstärksten Länder?".
- Ergebnisse anzeigen Die Plattform liefert die Ergebnisse der Abfrage mit der Möglichkeit, die entsprechenden Diagramme zu erstellen.
PandasAI eignet sich für eine Vielzahl von Datenanalyseszenarien, sei es für Geschäftsanalysen, akademische Forschung oder persönliche Projekte. Mit der Technologie zur Verarbeitung natürlicher Sprache können Benutzer leicht wertvolle Informationen aus Daten gewinnen, ohne komplexen Code schreiben zu müssen.