PandasAI: диалоговая платформа анализа данных для запросов данных и построения диаграмм на естественном языке
Общее введение
PandasAI - это платформа с открытым исходным кодом на базе Python, предназначенная для упрощения процесса анализа данных с помощью методов обработки естественного языка. Она позволяет пользователям взаимодействовать с базами данных (например, SQL, CSV, pandas, polars, mongodb, noSQL и т. д.) в разговорной манере. Платформа использует крупномасштабные языковые модели (например, GPT-3.5/4, Anthropic, VertexAI) и технологии Retrieval Augmented Generation (RAG), чтобы сделать анализ данных более интуитивным и эффективным как для технических, так и для нетехнических пользователей.


Список функций
- запрос на естественном языке: Легкий доступ к результатам анализа данных с помощью вопросов на естественном языке.
- Визуализация данных: Создание графиков и диаграмм для визуализации данных.
- Очистка данныхРабота с отсутствующими значениями и повышение качества данных.
- Поколение характеристик: Расширяйте набор данных, создавая новые характеристики.
- Поддержка нескольких источников данных: Подключение к CSV, XLSX, PostgreSQL, MySQL, BigQuery и многим другим источникам данных.
- Поддержка нескольких моделей: Интеграция GPT 3.5/4, Anthropic, VertexAI и других многоязычных моделей.
Использование помощи
Процесс установки
- Установка Docker : Убедитесь, что на вашей машине установлен Docker.
- склад клонов : Беги
git clone https://github.com/Sinaptik-AI/pandas-ai
. - Строительные платформы : Перейдите в каталог проекта и выполните команду
docker-compose build
. - Стартовая платформа : Беги
docker-compose up
а затем посетитеhttp://localhost:3000
.
Использование библиотеки PandasAI
- установщик ::
- Используйте pip:
pip install pandasai
- Используйте ПОЭТИКУ:
poetry add pandasai
- Используйте pip:
- библиотека импорта ::
import os
import pandas as pd
from pandasai import Agent
- Создание фреймов данных ::
sales_by_country = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
- Настройка ключа API ::
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
- Создание агента и запроса ::
agent = Agent(sales_by_country)
response = agent.chat('Which are the top 5 countries by sales?')
print(response)
- Создавайте диаграммы ::
agent.chat("Plot the histogram of countries showing for each one the gd. Use different colors for each bar")
Использование платформы PandasAI
- Платформы доступа : Доступ после запуска
http://localhost:3000
. - Загрузка данных : Загрузка файлов CSV или Excel через интерфейс.
- запрос на естественном языке : Введите вопрос в поле запроса, например, "Какие 5 стран занимают первое место по объему продаж?".
- Посмотреть результаты : Платформа вернет результаты запроса с возможностью построения соответствующих графиков.
PandasAI подходит для различных сценариев анализа данных, будь то бизнес-анализ, академические исследования или личные проекты. Благодаря технологии обработки естественного языка пользователи могут легко получать ценную информацию из данных без написания сложного кода.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...