PandasAI: una plataforma de diálogo de análisis de datos para consultas de datos y generación de gráficos en lenguaje natural
Últimos recursos sobre IAPublicado hace 9 meses Círculo de intercambio de inteligencia artificial 1.9K 00
Introducción general
PandasAI es una plataforma de código abierto basada en Python diseñada para simplificar el proceso de análisis de datos mediante técnicas de procesamiento del lenguaje natural. Permite a los usuarios interactuar con bases de datos (por ejemplo, SQL, CSV, pandas, polars, mongodb, noSQL, etc.) de forma conversacional. La plataforma utiliza modelos lingüísticos a gran escala (por ejemplo, GPT-3.5/4, Anthropic, VertexAI) y tecnologías de generación aumentada de recuperación (RAG) para que el análisis de datos resulte más intuitivo y eficiente tanto para usuarios técnicos como no técnicos.


Lista de funciones
- consulta en lenguaje natural: Fácil acceso a los resultados del análisis de datos mediante preguntas en lenguaje natural.
- Visualización de datosGenerar cuadros y gráficos para visualizar datos.
- Limpieza de datosTratamiento de los valores omitidos y mejora de la calidad de los datos.
- Generación de funcionesMejora el conjunto de datos generando nuevas características.
- Compatibilidad con múltiples fuentes de datosConéctate a CSV, XLSX, PostgreSQL, MySQL, BigQuery y muchas otras fuentes de datos.
- Compatibilidad con varios modelosIntegración de GPT 3.5/4, Anthropic, VertexAI y otros modelos multilingües.
Utilizar la ayuda
Proceso de instalación
- Instalación de Docker Asegúrese de que tiene Docker instalado en su máquina.
- almacén de clones : Ejecutar
git clone https://github.com/Sinaptik-AI/pandas-ai
. - Construir plataformas : Vaya al directorio del proyecto y ejecute
docker-compose build
. - Plataforma de lanzamiento : Ejecutar
docker-compose up
y visitehttp://localhost:3000
.
Uso de la biblioteca PandasAI
- instalador ::
- Usa pip:
pip install pandasai
- Utiliza la POESÍA:
poetry add pandasai
- Usa pip:
- importar biblioteca ::
import os
import pandas as pd
from pandasai import Agent
- Creación de marcos de datos ::
sales_by_country = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
- Configuración de la clave API ::
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
- Crear agente y consulta ::
agent = Agent(sales_by_country)
response = agent.chat('Which are the top 5 countries by sales?')
print(response)
- Generar gráficos ::
agent.chat("Plot the histogram of countries showing for each one the gd. Use different colors for each bar")
Uso de la plataforma PandasAI
- Plataformas de acceso Acceso posterior a la puesta en marcha
http://localhost:3000
. - Cargar datos Carga archivos CSV o Excel a través de la interfaz.
- consulta en lenguaje natural Introduzca una pregunta en el cuadro de consulta, por ejemplo: "¿Cuáles son los 5 primeros países por ventas?".
- Ver resultados La plataforma devolverá los resultados de la consulta con la opción de generar los gráficos correspondientes.
PandasAI es adecuado para una gran variedad de escenarios de análisis de datos, ya sea análisis empresarial, investigación académica o proyectos personales. Gracias a la tecnología de procesamiento del lenguaje natural, los usuarios pueden obtener fácilmente información valiosa de los datos sin necesidad de escribir código complejo.
© declaración de copyright
El artículo está protegido por derechos de autor y no debe reproducirse sin autorización.
Artículos relacionados
Sin comentarios...