Allgemeine Einführung
PandasAI ist eine auf Python basierende Open-Source-Plattform, die den Prozess der Datenanalyse durch Techniken der natürlichen Sprachverarbeitung vereinfachen soll. Sie ermöglicht Nutzern die Interaktion mit Datenbanken (z.B. SQL, CSV, Pandas, Polars, Mongodb, NoSQL, etc.) in einer konversationellen Weise. Die Plattform nutzt umfangreiche Sprachmodelle (z.B. GPT-3.5/4, Anthropic, VertexAI) und Retrieval Augmented Generation (RAG) Technologien, um die Datenanalyse sowohl für technische als auch für nicht-technische Benutzer intuitiver und effizienter zu gestalten.
Funktionsliste
- Abfrage in natürlicher SpracheEinfacher Zugang zu Datenanalyseergebnissen durch Fragen in natürlicher Sprache.
- Visualisierung der DatenErstellen von Diagrammen und Schaubildern zur Visualisierung von Daten.
- DatenbereinigungUmgang mit fehlenden Werten und Verbesserung der Datenqualität.
- Feature-GenerierungVerbessern Sie den Datensatz, indem Sie neue Merkmale erzeugen.
- Unterstützung mehrerer DatenquellenVerbindung zu CSV, XLSX, PostgreSQL, MySQL, BigQuery und vielen anderen Datenquellen.
- Unterstützung mehrerer ModelleIntegration von GPT 3.5/4, Anthropic, VertexAI und anderen mehrsprachigen Modellen.
Hilfe verwenden
Ablauf der Installation
- Installation von Docker Vergewissern Sie sich, dass Sie Docker auf Ihrem Rechner installiert haben.
- Klon-Lager : Lauf
git clone https://github.com/Sinaptik-AI/pandas-ai
. - Plattformen bauen : Wechseln Sie in das Projektverzeichnis und führen Sie
docker-compose bauen
. - Plattform starten : Lauf
docker-compose aufwärts
und besuchen Sie dannhttp://localhost:3000
.
Verwendung der PandasAI-Bibliothek
- Installateur ::
- Verwenden Sie pip:
pip install pandasai
- Verwenden Sie POETRY:
Gedichte hinzufügen pandasai
- Verwenden Sie pip:
- Importbibliothek ::
os importieren
importiere pandas as pd
from pandasai importieren Agent
- Erstellen von Datenframes ::
sales_by_country = pd.DataFrame({
"Land": ["Vereinigte Staaten", "Vereinigtes Königreich", "Frankreich", "Deutschland", "Italien", "Spanien", "Kanada", "Australien", "Japan", "China"],
"Umsatz": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
- Konfigurieren des API-Schlüssels ::
os.environ["PANDASAI_API_KEY"] = "IHR_API_KEY"
- Agent und Abfrage erstellen ::
agent = Agent(sales_by_country)
response = agent.chat('Welches sind die 5 umsatzstärksten Länder?')
print(Antwort)
- Diagramme generieren ::
agent.chat("Stellen Sie das Histogramm der Länder dar und zeigen Sie für jedes Land das gd an. Verwenden Sie unterschiedliche Farben für jeden Balken")
Verwendung der PandasAI-Plattform
- Zugangsplattformen Zugang nach der Inbetriebnahme
http://localhost:3000
. - Daten hochladen Hochladen von CSV- oder Excel-Dateien über die Schnittstelle.
- Abfrage in natürlicher Sprache Geben Sie eine Frage in das Abfragefeld ein, z. B. "Welches sind die 5 umsatzstärksten Länder?".
- Ergebnisse anzeigen Die Plattform liefert die Ergebnisse der Abfrage mit der Möglichkeit, die entsprechenden Diagramme zu erstellen.
PandasAI eignet sich für eine Vielzahl von Datenanalyseszenarien, sei es für Geschäftsanalysen, akademische Forschung oder persönliche Projekte. Mit der Technologie zur Verarbeitung natürlicher Sprache können Benutzer leicht wertvolle Informationen aus Daten gewinnen, ohne komplexen Code schreiben zu müssen.