Introdução geral
O PandasAI é uma plataforma de código aberto baseada em Python projetada para simplificar o processo de análise de dados por meio de técnicas de processamento de linguagem natural. Ela permite que os usuários interajam com bancos de dados (por exemplo, SQL, CSV, pandas, polars, mongodb, noSQL etc.) de forma conversacional. A plataforma utiliza modelos de linguagem em larga escala (por exemplo, GPT-3.5/4, Anthropic, VertexAI) e tecnologias RAG (Retrieval Augmented Generation) para tornar a análise de dados mais intuitiva e eficiente para usuários técnicos e não técnicos.
Lista de funções
- consulta em linguagem naturalAcesso fácil aos resultados da análise de dados por meio de perguntas em linguagem natural.
- Visualização de dadosGeração de tabelas e gráficos para visualização de dados.
- Limpeza de dadosLidando com valores ausentes e melhorando a qualidade dos dados.
- Geração de recursosAprimore o conjunto de dados gerando novos recursos.
- Suporte a várias fontes de dadosConexão com CSV, XLSX, PostgreSQL, MySQL, BigQuery e muitas outras fontes de dados.
- Suporte a vários modelosIntegração do GPT 3.5/4, Anthropic, VertexAI e outros modelos multilíngues.
Usando a Ajuda
Processo de instalação
- Instalação do Docker Verifique se o Docker está instalado em seu computador.
- armazém de clones : Executar
git clone https://github.com/Sinaptik-AI/pandas-ai
. - Criação de plataformas Vá para o diretório do projeto e execute
Construção do docker-compose
. - Plataforma de lançamento : Executar
docker-compose up
e depois visitehttp://localhost:3000
.
Usando a biblioteca PandasAI
- instalador ::
- Use o pip:
pip install pandasai
- Use a POESIA:
poesia adicionar pandasai
- Use o pip:
- biblioteca de importação ::
import os
import pandas as pd
from pandasai import Agent
- Criação de quadros de dados ::
sales_by_country = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
- Configuração da chave de API ::
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
- Criar agente e consulta ::
agent = Agent(sales_by_country)
response = agent.chat('Quais são os 5 principais países por vendas?')
print(response)
- Gerar gráficos ::
agent.chat("Trace o histograma dos países mostrando para cada um o gd. Use cores diferentes para cada barra")
Usando a plataforma PandasAI
- Plataformas de acesso Acesso pós-inicialização
http://localhost:3000
. - Carregar dados Upload de arquivos CSV ou Excel por meio da interface.
- consulta em linguagem natural Digite uma pergunta na caixa de consulta, por exemplo, "Quais são os 5 principais países por vendas?".
- Exibir resultados A plataforma retornará os resultados da consulta com a opção de gerar os gráficos apropriados.
O PandasAI é adequado para uma variedade de cenários de análise de dados, seja para análise de negócios, pesquisa acadêmica ou projetos pessoais. Com a tecnologia de processamento de linguagem natural, os usuários podem obter facilmente informações valiosas dos dados sem escrever códigos complexos.