TableGPT Agent: интеллектуальный инструмент, предназначенный для анализа сложных табличных данных

Общее введение

TableGPT Agent - это интеллектуальный инструмент, основанный на проекте с открытым исходным кодом GitHub и предназначенный для обработки и анализа табличных данных. Он опирается на Большую языковую модель TableGPT2, которая использует взаимодействия на естественном языке, чтобы облегчить пользователям запросы, манипуляции и понимание сложного содержимого таблиц. Будь то извлечение данных из CSV-файлов, построение визуальных диаграмм или ответы на конкретные вопросы на основе таблиц, этот инструмент эффективно справится с поставленной задачей. Он был разработан командой tablegpt и построен на основе Ланграф Он поддерживает различные сценарии применения таблиц и идеально подходит для пользователей, которым нужно анализировать данные, но которые не умеют программировать. Проект лицензирован под лицензией Apache 2.0, и разработчики поощряются к участию, а активная поддержка сообщества осуществляется на GitHub.

TableGPT Agent:专为分析复杂表格数据设计的智能工具

 

Список функций

  • Чтение и обработка данных таблицы: Поддерживает чтение и структурирование табличных данных из локально загруженных файлов CSV, Excel или баз данных.
  • запрос на естественном языке:: Пользователи могут задавать вопросы на повседневном языке, например "Сколько человек выжило?" или "Какие товары самые продаваемые?" или "Какой самый продаваемый товар?". : Пользователи могут задавать вопросы на повседневном языке, например, "Сколько мужчин выжило?
  • Автоматическая генерация кода: Генерируйте код Python на основе потребностей пользователя, например, для фильтрации данных, вычисления статистики или построения графиков.
  • Поддержка визуализации данных: Работайте с инструментом для создания линейных графиков, гистограмм и других наглядных результатов, чтобы визуально отобразить выводы, сделанные в результате анализа данных.
  • Поддержка задач по сложным формам:: Работа с многослойными табличными структурами или нерегулярными данными для проведения точного анализа.
  • функция памяти сеансов: Поддержка нескольких последовательных раундов диалога с сохранением контекста анализа через checkpointer и session_id.
  • Масштабируемость с открытым исходным кодом: Предоставляет богатый API и документацию, позволяющую разработчикам настраивать функции или интегрировать их в другие проекты.

 

Использование помощи

Процесс установки

TableGPT Agent - это инструмент на базе Python, для запуска которого требуется определенная настройка среды. Ниже приведены подробные шаги по установке:

1. Подготовка окружающей среды

  • Установка Python: Убедитесь, что на вашем компьютере установлен Python 3.8 или более поздняя версия, которую можно загрузить с официального сайта Python.
  • Установка GitGitHub - это инструмент клонирования репозиториев GitHub, доступный для пользователей Windows/Mac с сайта Git.
  • Установка vLLM: TableGPT Agent Recommended vLLM Разверните модель TableGPT2, чтобы обеспечить эффективный вывод. Выполните следующую команду:
    pip install vllm==0.5.5 --extra-index-url https://download.pytorch.org/whl/cu124

(Скорректировано в соответствии с вашей версией CUDA) cu124(Вы можете пропустить этот шаг, если у вас нет GPU, но вам придется развернуть модель вручную).

2. Клонирование складов

Откройте терминал (CMD или PowerShell для Windows, Terminal для Mac/Linux) и запустите его:

git clone https://github.com/tablegpt/tablegpt-agent.git
cd tablegpt-agent

3. Установка зависимостей

В каталог проекта установите необходимые библиотеки Python:

pip install -r requirements.txt

Установите дополнительные зависимости, если вам нужно запустить полную функциональность локально:

pip install ".[local]"

4. Развертывание модели TableGPT2

TableGPT Agent требует поддержки модели TableGPT2. Сначала загрузите модель с сайта Hugging Face (например, TableGPT2-7B), а затем запустите службу с помощью vLLM:

python -m vllm.entrypoints.openai.api_server --served-model-name TableGPT2-7B --model path/to/weights

Когда служба запускается, она по умолчанию прослушивает http://localhost:8000Если вы не хотите использовать этот URL, запишите его.

5. Настройка агентов

Отредактируйте код или файл конфигурации, чтобы указать API-адрес LLM, например, на развернутую службу vLLM:

llm = ChatOpenAI(openai_api_base="http://localhost:8000/v1", openai_api_key="whatever", model_name="TableGPT2-7B")

Использование

После завершения установки TableGPT Agent готов к работе. Ниже приведен подробный порядок работы с основными функциями:

Функция 1: Чтение данных таблицы

  1. Подготовка файлов данных: Поместите файл CSV или Excel в локальный каталог (например. gpt_workspace (папка).
  2. Агент по запуску: Выполните следующий код в среде Python, чтобы инициализировать агента:
    from langchain_openai import ChatOpenAI
    from langgraph.checkpoint.memory import MemorySaver
    from pybox import LocalPyBoxManager
    from tablegpt.agent import create_tablegpt_graph
    llm = ChatOpenAI(openai_api_base="http://localhost:8000/v1", openai_api_key="whatever", model_name="TableGPT2-7B")
    pybox_manager = LocalPyBoxManager()
    checkpointer = MemorySaver()
    agent = create_tablegpt_graph(llm=llm, pybox_manager=pybox_manager, checkpointer=checkpointer, session_id="my-session")
    
  3. Загрузка файлов: Используйте следующий код, чтобы загрузить файл и позволить агенту прочитать его:
    from datetime import date
    from tablegpt.agent.file_reading import Stage
    from langchain_core.messages import HumanMessage
    attachment_msg = HumanMessage(content="请读取文件 data.csv", additional_kwargs={"file_path": "path/to/data.csv"})
    response = await agent.ainvoke(
    input={"entry_message": attachment_msg, "processing_stage": Stage.UPLOADED, "messages": [attachment_msg], "date": date.today()},
    config={"configurable": {"thread_id": "my-thread"}}
    )
    print(response["messages"])
    

    Агент возвращает подтверждение о том, что файл прочитан.

Функция 2: Запрос на естественном языке

  1. задавать вопросы: В той же сессии продолжайте вводить вопросы:
    human_message = HumanMessage(content="有多少行数据?")
    response = await agent.ainvoke(
    input={"messages": [human_message], "date": date.today()},
    config={"configurable": {"thread_id": "my-thread"}}
    )
    print(response["messages"])
    
  2. в конце концов: Агент вернет ответ типа "Есть 100 строк данных".

Функция 3: Создание диаграмм визуализации

  1. Диаграмма запросов:: Введите что-нибудь вроде "Нарисовать гистограмму продаж":
    human_message = HumanMessage(content="绘制销售额的柱状图")
    async for event in agent.astream_events(
    input={"messages": [human_message], "date": date.today()},
    config={"configurable": {"thread_id": "my-thread"}},
    version="v2"
    ):
    if event["event"] == "on_chat_model_end":
    print(event["data"]["output"])
    
  2. экспорт: Агент генерирует код на языке Python и возвращает результаты построения графика (при локальном запуске библиотеки, например matplotlib).

Функция 4: Обработка сложных задач

Для многоуровневых таблиц или нерегулярных данных задайте прямой вопрос, например "Посчитайте средний возраст сотрудников каждого отдела", и агент автоматически проанализирует и сформирует результаты.

предостережение

  • экологическая зависимость: Убедитесь, что сеть не заблокирована и служба vLLM работает правильно.
  • путь к файлу: Укажите правильный путь при загрузке файлов.
  • Управление сеансами: Используйте тот же session_id ответить пением thread_id Сохраняйте контекстуальную преемственность.

С помощью описанных выше шагов вы сможете легко начать работу с TableGPT Agent и пройти весь процесс от чтения данных до их анализа!

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...