TableGPT Agent: интеллектуальный инструмент, предназначенный для анализа сложных табличных данных
Общее введение
TableGPT Agent - это интеллектуальный инструмент, основанный на проекте с открытым исходным кодом GitHub и предназначенный для обработки и анализа табличных данных. Он опирается на Большую языковую модель TableGPT2, которая использует взаимодействия на естественном языке, чтобы облегчить пользователям запросы, манипуляции и понимание сложного содержимого таблиц. Будь то извлечение данных из CSV-файлов, построение визуальных диаграмм или ответы на конкретные вопросы на основе таблиц, этот инструмент эффективно справится с поставленной задачей. Он был разработан командой tablegpt и построен на основе Ланграф Он поддерживает различные сценарии применения таблиц и идеально подходит для пользователей, которым нужно анализировать данные, но которые не умеют программировать. Проект лицензирован под лицензией Apache 2.0, и разработчики поощряются к участию, а активная поддержка сообщества осуществляется на GitHub.

Список функций
- Чтение и обработка данных таблицы: Поддерживает чтение и структурирование табличных данных из локально загруженных файлов CSV, Excel или баз данных.
- запрос на естественном языке:: Пользователи могут задавать вопросы на повседневном языке, например "Сколько человек выжило?" или "Какие товары самые продаваемые?" или "Какой самый продаваемый товар?". : Пользователи могут задавать вопросы на повседневном языке, например, "Сколько мужчин выжило?
- Автоматическая генерация кода: Генерируйте код Python на основе потребностей пользователя, например, для фильтрации данных, вычисления статистики или построения графиков.
- Поддержка визуализации данных: Работайте с инструментом для создания линейных графиков, гистограмм и других наглядных результатов, чтобы визуально отобразить выводы, сделанные в результате анализа данных.
- Поддержка задач по сложным формам:: Работа с многослойными табличными структурами или нерегулярными данными для проведения точного анализа.
- функция памяти сеансов: Поддержка нескольких последовательных раундов диалога с сохранением контекста анализа через checkpointer и session_id.
- Масштабируемость с открытым исходным кодом: Предоставляет богатый API и документацию, позволяющую разработчикам настраивать функции или интегрировать их в другие проекты.
Использование помощи
Процесс установки
TableGPT Agent - это инструмент на базе Python, для запуска которого требуется определенная настройка среды. Ниже приведены подробные шаги по установке:
1. Подготовка окружающей среды
- Установка Python: Убедитесь, что на вашем компьютере установлен Python 3.8 или более поздняя версия, которую можно загрузить с официального сайта Python.
- Установка GitGitHub - это инструмент клонирования репозиториев GitHub, доступный для пользователей Windows/Mac с сайта Git.
- Установка vLLM: TableGPT Agent Recommended vLLM Разверните модель TableGPT2, чтобы обеспечить эффективный вывод. Выполните следующую команду:
pip install vllm==0.5.5 --extra-index-url https://download.pytorch.org/whl/cu124
(Скорректировано в соответствии с вашей версией CUDA) cu124
(Вы можете пропустить этот шаг, если у вас нет GPU, но вам придется развернуть модель вручную).
2. Клонирование складов
Откройте терминал (CMD или PowerShell для Windows, Terminal для Mac/Linux) и запустите его:
git clone https://github.com/tablegpt/tablegpt-agent.git
cd tablegpt-agent
3. Установка зависимостей
В каталог проекта установите необходимые библиотеки Python:
pip install -r requirements.txt
Установите дополнительные зависимости, если вам нужно запустить полную функциональность локально:
pip install ".[local]"
4. Развертывание модели TableGPT2
TableGPT Agent требует поддержки модели TableGPT2. Сначала загрузите модель с сайта Hugging Face (например, TableGPT2-7B), а затем запустите службу с помощью vLLM:
python -m vllm.entrypoints.openai.api_server --served-model-name TableGPT2-7B --model path/to/weights
Когда служба запускается, она по умолчанию прослушивает http://localhost:8000
Если вы не хотите использовать этот URL, запишите его.
5. Настройка агентов
Отредактируйте код или файл конфигурации, чтобы указать API-адрес LLM, например, на развернутую службу vLLM:
llm = ChatOpenAI(openai_api_base="http://localhost:8000/v1", openai_api_key="whatever", model_name="TableGPT2-7B")
Использование
После завершения установки TableGPT Agent готов к работе. Ниже приведен подробный порядок работы с основными функциями:
Функция 1: Чтение данных таблицы
- Подготовка файлов данных: Поместите файл CSV или Excel в локальный каталог (например.
gpt_workspace
(папка). - Агент по запуску: Выполните следующий код в среде Python, чтобы инициализировать агента:
from langchain_openai import ChatOpenAI from langgraph.checkpoint.memory import MemorySaver from pybox import LocalPyBoxManager from tablegpt.agent import create_tablegpt_graph llm = ChatOpenAI(openai_api_base="http://localhost:8000/v1", openai_api_key="whatever", model_name="TableGPT2-7B") pybox_manager = LocalPyBoxManager() checkpointer = MemorySaver() agent = create_tablegpt_graph(llm=llm, pybox_manager=pybox_manager, checkpointer=checkpointer, session_id="my-session")
- Загрузка файлов: Используйте следующий код, чтобы загрузить файл и позволить агенту прочитать его:
from datetime import date from tablegpt.agent.file_reading import Stage from langchain_core.messages import HumanMessage attachment_msg = HumanMessage(content="请读取文件 data.csv", additional_kwargs={"file_path": "path/to/data.csv"}) response = await agent.ainvoke( input={"entry_message": attachment_msg, "processing_stage": Stage.UPLOADED, "messages": [attachment_msg], "date": date.today()}, config={"configurable": {"thread_id": "my-thread"}} ) print(response["messages"])
Агент возвращает подтверждение о том, что файл прочитан.
Функция 2: Запрос на естественном языке
- задавать вопросы: В той же сессии продолжайте вводить вопросы:
human_message = HumanMessage(content="有多少行数据?") response = await agent.ainvoke( input={"messages": [human_message], "date": date.today()}, config={"configurable": {"thread_id": "my-thread"}} ) print(response["messages"])
- в конце концов: Агент вернет ответ типа "Есть 100 строк данных".
Функция 3: Создание диаграмм визуализации
- Диаграмма запросов:: Введите что-нибудь вроде "Нарисовать гистограмму продаж":
human_message = HumanMessage(content="绘制销售额的柱状图") async for event in agent.astream_events( input={"messages": [human_message], "date": date.today()}, config={"configurable": {"thread_id": "my-thread"}}, version="v2" ): if event["event"] == "on_chat_model_end": print(event["data"]["output"])
- экспорт: Агент генерирует код на языке Python и возвращает результаты построения графика (при локальном запуске библиотеки, например matplotlib).
Функция 4: Обработка сложных задач
Для многоуровневых таблиц или нерегулярных данных задайте прямой вопрос, например "Посчитайте средний возраст сотрудников каждого отдела", и агент автоматически проанализирует и сформирует результаты.
предостережение
- экологическая зависимость: Убедитесь, что сеть не заблокирована и служба vLLM работает правильно.
- путь к файлу: Укажите правильный путь при загрузке файлов.
- Управление сеансами: Используйте тот же
session_id
ответить пениемthread_id
Сохраняйте контекстуальную преемственность.
С помощью описанных выше шагов вы сможете легко начать работу с TableGPT Agent и пройти весь процесс от чтения данных до их анализа!
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...