PandasAI: диалоговая платформа анализа данных для запросов данных и построения диаграмм на естественном языке

Общее введение

PandasAI - это платформа с открытым исходным кодом на базе Python, предназначенная для упрощения процесса анализа данных с помощью методов обработки естественного языка. Она позволяет пользователям взаимодействовать с базами данных (например, SQL, CSV, pandas, polars, mongodb, noSQL и т. д.) в разговорной манере. Платформа использует крупномасштабные языковые модели (например, GPT-3.5/4, Anthropic, VertexAI) и технологии Retrieval Augmented Generation (RAG), чтобы сделать анализ данных более интуитивным и эффективным как для технических, так и для нетехнических пользователей.

PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

 

PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

 

Список функций

  • запрос на естественном языке: Легкий доступ к результатам анализа данных с помощью вопросов на естественном языке.
  • Визуализация данных: Создание графиков и диаграмм для визуализации данных.
  • Очистка данныхРабота с отсутствующими значениями и повышение качества данных.
  • Поколение характеристик: Расширяйте набор данных, создавая новые характеристики.
  • Поддержка нескольких источников данных: Подключение к CSV, XLSX, PostgreSQL, MySQL, BigQuery и многим другим источникам данных.
  • Поддержка нескольких моделей: Интеграция GPT 3.5/4, Anthropic, VertexAI и других многоязычных моделей.

 

Использование помощи

Процесс установки

  1. Установка Docker : Убедитесь, что на вашей машине установлен Docker.
  2. склад клонов : Бегиgit clone https://github.com/Sinaptik-AI/pandas-ai.
  3. Строительные платформы : Перейдите в каталог проекта и выполните командуdocker-compose build.
  4. Стартовая платформа : Бегиdocker-compose upа затем посетитеhttp://localhost:3000.

Использование библиотеки PandasAI

  1. установщик ::
    • Используйте pip:pip install pandasai
    • Используйте ПОЭТИКУ:poetry add pandasai
  2. библиотека импорта ::
import os
import pandas as pd
from pandasai import Agent
  1. Создание фреймов данных ::
sales_by_country = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
  1. Настройка ключа API ::
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
  1. Создание агента и запроса ::
agent = Agent(sales_by_country)
response = agent.chat('Which are the top 5 countries by sales?')
print(response)
  1. Создавайте диаграммы ::
agent.chat("Plot the histogram of countries showing for each one the gd. Use different colors for each bar")

Использование платформы PandasAI

  1. Платформы доступа : Доступ после запускаhttp://localhost:3000.
  2. Загрузка данных : Загрузка файлов CSV или Excel через интерфейс.
  3. запрос на естественном языке : Введите вопрос в поле запроса, например, "Какие 5 стран занимают первое место по объему продаж?".
  4. Посмотреть результаты : Платформа вернет результаты запроса с возможностью построения соответствующих графиков.

PandasAI подходит для различных сценариев анализа данных, будь то бизнес-анализ, академические исследования или личные проекты. Благодаря технологии обработки естественного языка пользователи могут легко получать ценную информацию из данных без написания сложного кода.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...