TableGPT Agent : un outil intelligent conçu pour analyser des données tabulaires complexes
Introduction générale
TableGPT Agent est un outil intelligent basé sur le projet open source GitHub conçu pour traiter et analyser des données tabulaires. Il s'appuie sur le modèle de langage TableGPT2 Big Language Model, qui utilise les interactions du langage naturel pour permettre aux utilisateurs d'interroger, de manipuler et de comprendre facilement le contenu de tableaux complexes. Qu'il s'agisse d'extraire des données de fichiers CSV, de générer des graphiques visuels ou de répondre à des questions spécifiques basées sur des tableaux, cet outil permet de faire le travail efficacement. Il a été développé par l'équipe tablegpt et s'appuie sur la technologie Langgraph Il prend en charge une grande variété de scénarios d'application liés aux tableaux et est idéal pour les utilisateurs qui ont besoin d'analyser des données mais qui ne sont pas doués pour la programmation. Le projet est placé sous la licence Apache 2.0 et les développeurs sont encouragés à y contribuer, grâce au soutien actif de la communauté sur GitHub.

Liste des fonctions
- Lecture et traitement des données du tableauLe logiciel permet de lire et de structurer les données d'un tableau à partir de fichiers CSV, Excel ou de bases de données téléchargés localement.
- requête en langage naturelLes utilisateurs peuvent poser des questions en langage courant, telles que "Combien d'hommes ont survécu ?" ou "Quels sont les produits les plus vendus ?" ou "Quel est le produit le plus vendu ?". Les utilisateurs peuvent poser des questions dans un langage courant, telles que "Combien d'hommes ont survécu ?
- Génération automatique de codeLes logiciels d'aide à la décision : Générer du code Python en fonction des besoins de l'utilisateur, tels que le filtrage de données, le calcul de statistiques ou l'élaboration de graphiques.
- Aide à la visualisation des donnéesLes résultats de l'analyse des données sont présentés sous forme de graphiques linéaires, de diagrammes à barres et d'autres résultats visuels.
- Formulaires complexes Soutien aux tâches: : Manipuler des structures tabulaires à plusieurs niveaux ou des données irrégulières afin de fournir des analyses précises.
- fonction de mémoire de sessionSupport pour plusieurs cycles de dialogue consécutifs en préservant le contexte d'analyse grâce au checkpointer et au session_id.
- Évolutivité de l'Open SourceLe système de gestion de l'information : il fournit une API riche et une documentation qui permet aux développeurs de personnaliser les fonctionnalités ou de les intégrer dans d'autres projets.
Utiliser l'aide
Processus d'installation
TableGPT Agent est un outil basé sur Python qui nécessite une certaine configuration de l'environnement pour fonctionner. Voici les étapes détaillées de l'installation :
1. préparation à l'environnement
- Installation de PythonPour ce faire, vous devez vous assurer que Python 3.8 ou une version ultérieure est installée sur votre ordinateur. Vous pouvez la télécharger à partir du site Web de Python.
- Installation de GitGitHub est un outil de clonage pour les dépôts GitHub. Il est disponible pour les utilisateurs Windows/Mac et peut être téléchargé depuis le site web de Git.
- Installation de vLLMTableGPT Agent recommandé vLLM Déployez le modèle TableGPT2 pour garantir une inférence efficace. Exécutez la commande suivante :
pip install vllm==0.5.5 --extra-index-url https://download.pytorch.org/whl/cu124
(Adapté à votre version de CUDA) cu124
(Vous pouvez sauter cette étape si vous n'avez pas de GPU, mais vous devrez déployer le modèle manuellement).
2. clonage d'entrepôts
Ouvrez un terminal (CMD ou PowerShell pour Windows, Terminal pour Mac/Linux) et exécutez-le :
git clone https://github.com/tablegpt/tablegpt-agent.git
cd tablegpt-agent
3. installation des dépendances
Dans le répertoire du projet, installez les bibliothèques Python requises :
pip install -r requirements.txt
Installez des dépendances supplémentaires si vous avez besoin d'exécuter toutes les fonctionnalités localement :
pip install ".[local]"
4. déploiement du modèle TableGPT2
TableGPT Agent nécessite le support du modèle TableGPT2. Téléchargez d'abord le modèle à partir de Hugging Face (par exemple TableGPT2-7B), puis démarrez le service à l'aide de vLLM :
python -m vllm.entrypoints.openai.api_server --served-model-name TableGPT2-7B --model path/to/weights
Lorsque le service démarre, il écoute par défaut le canal http://localhost:8000
Si vous ne souhaitez pas utiliser cette URL, écrivez-la.
5. configuration des agents
Modifiez le code ou le fichier de configuration pour faire pointer l'adresse API du LLM vers le service vLLM que vous avez déployé, par exemple :
llm = ChatOpenAI(openai_api_base="http://localhost:8000/v1", openai_api_key="whatever", model_name="TableGPT2-7B")
Utilisation
Une fois l'installation terminée, TableGPT Agent est prêt à fonctionner. Vous trouverez ci-dessous la procédure d'utilisation détaillée des principales fonctions :
Fonction 1 : Lecture des données du tableau
- Préparation des fichiers de donnéesLe fichier CSV ou Excel doit être placé dans un répertoire local (par ex.
gpt_workspace
(dossier). - Agent de lancementL'agent doit être initialisé dans un environnement Python par l'exécution du code suivant :
from langchain_openai import ChatOpenAI from langgraph.checkpoint.memory import MemorySaver from pybox import LocalPyBoxManager from tablegpt.agent import create_tablegpt_graph llm = ChatOpenAI(openai_api_base="http://localhost:8000/v1", openai_api_key="whatever", model_name="TableGPT2-7B") pybox_manager = LocalPyBoxManager() checkpointer = MemorySaver() agent = create_tablegpt_graph(llm=llm, pybox_manager=pybox_manager, checkpointer=checkpointer, session_id="my-session")
- Téléchargement de fichiersLe code suivant permet de télécharger un fichier et de le faire lire par l'agent :
from datetime import date from tablegpt.agent.file_reading import Stage from langchain_core.messages import HumanMessage attachment_msg = HumanMessage(content="请读取文件 data.csv", additional_kwargs={"file_path": "path/to/data.csv"}) response = await agent.ainvoke( input={"entry_message": attachment_msg, "processing_stage": Stage.UPLOADED, "messages": [attachment_msg], "date": date.today()}, config={"configurable": {"thread_id": "my-thread"}} ) print(response["messages"])
L'agent renvoie un accusé de réception indiquant que le fichier a été lu.
Fonction 2 : Requête en langage naturel
- poser des questionsDans la même session, continuez à poser des questions :
human_message = HumanMessage(content="有多少行数据?") response = await agent.ainvoke( input={"messages": [human_message], "date": date.today()}, config={"configurable": {"thread_id": "my-thread"}} ) print(response["messages"])
- en fin de compteL'agent renverra une réponse telle que "Il y a 100 lignes de données".
Fonction 3 : Générer des graphiques de visualisation
- Tableau des demandes: : Saisissez quelque chose comme "Dessinez un diagramme à barres des ventes" :
human_message = HumanMessage(content="绘制销售额的柱状图") async for event in agent.astream_events( input={"messages": [human_message], "date": date.today()}, config={"configurable": {"thread_id": "my-thread"}}, version="v2" ): if event["event"] == "on_chat_model_end": print(event["data"]["output"])
- exportationsL'agent génère du code Python et renvoie les résultats graphiques (avec une bibliothèque telle que matplotlib fonctionnant localement).
Fonction 4 : Traitement des tâches complexes
Pour les tableaux à plusieurs niveaux ou les données irrégulières, posez une question directe telle que "Comptez l'âge moyen de chaque département" et l'agent analysera et générera automatiquement les résultats.
mise en garde
- la dépendance environnementaleLe service vLLM est un service d'assistance à l'utilisateur et à l'utilisateur final.
- chemin d'accès au fichierLes fichiers peuvent être téléchargés à partir de n'importe quel endroit dans le monde, mais ils ne peuvent pas être téléchargés à partir de n'importe où.
- Gestion des sessions: Utiliser la même
session_id
répondre en chantantthread_id
Maintenir la continuité contextuelle.
Avec les étapes ci-dessus, vous pouvez facilement démarrer avec TableGPT Agent et compléter l'ensemble du processus, de la lecture des données à l'analyse !
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...