PandasAI: una plataforma de diálogo de análisis de datos para consultas de datos y generación de gráficos en lenguaje natural

Introducción general

PandasAI es una plataforma de código abierto basada en Python diseñada para simplificar el proceso de análisis de datos mediante técnicas de procesamiento del lenguaje natural. Permite a los usuarios interactuar con bases de datos (por ejemplo, SQL, CSV, pandas, polars, mongodb, noSQL, etc.) de forma conversacional. La plataforma utiliza modelos lingüísticos a gran escala (por ejemplo, GPT-3.5/4, Anthropic, VertexAI) y tecnologías de generación aumentada de recuperación (RAG) para que el análisis de datos resulte más intuitivo y eficiente tanto para usuarios técnicos como no técnicos.

PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

 

PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

 

Lista de funciones

  • consulta en lenguaje natural: Fácil acceso a los resultados del análisis de datos mediante preguntas en lenguaje natural.
  • Visualización de datosGenerar cuadros y gráficos para visualizar datos.
  • Limpieza de datosTratamiento de los valores omitidos y mejora de la calidad de los datos.
  • Generación de funcionesMejora el conjunto de datos generando nuevas características.
  • Compatibilidad con múltiples fuentes de datosConéctate a CSV, XLSX, PostgreSQL, MySQL, BigQuery y muchas otras fuentes de datos.
  • Compatibilidad con varios modelosIntegración de GPT 3.5/4, Anthropic, VertexAI y otros modelos multilingües.

 

Utilizar la ayuda

Proceso de instalación

  1. Instalación de Docker Asegúrese de que tiene Docker instalado en su máquina.
  2. almacén de clones : Ejecutargit clone https://github.com/Sinaptik-AI/pandas-ai.
  3. Construir plataformas : Vaya al directorio del proyecto y ejecutedocker-compose build.
  4. Plataforma de lanzamiento : Ejecutardocker-compose upy visitehttp://localhost:3000.

Uso de la biblioteca PandasAI

  1. instalador ::
    • Usa pip:pip install pandasai
    • Utiliza la POESÍA:poetry add pandasai
  2. importar biblioteca ::
import os
import pandas as pd
from pandasai import Agent
  1. Creación de marcos de datos ::
sales_by_country = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
  1. Configuración de la clave API ::
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
  1. Crear agente y consulta ::
agent = Agent(sales_by_country)
response = agent.chat('Which are the top 5 countries by sales?')
print(response)
  1. Generar gráficos ::
agent.chat("Plot the histogram of countries showing for each one the gd. Use different colors for each bar")

Uso de la plataforma PandasAI

  1. Plataformas de acceso Acceso posterior a la puesta en marchahttp://localhost:3000.
  2. Cargar datos Carga archivos CSV o Excel a través de la interfaz.
  3. consulta en lenguaje natural Introduzca una pregunta en el cuadro de consulta, por ejemplo: "¿Cuáles son los 5 primeros países por ventas?".
  4. Ver resultados La plataforma devolverá los resultados de la consulta con la opción de generar los gráficos correspondientes.

PandasAI es adecuado para una gran variedad de escenarios de análisis de datos, ya sea análisis empresarial, investigación académica o proyectos personales. Gracias a la tecnología de procesamiento del lenguaje natural, los usuarios pueden obtener fácilmente información valiosa de los datos sin necesidad de escribir código complejo.

© declaración de copyright
AiPPT

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...