NVIDIA et LangChain lancent un guide avancé sur la rédaction de rapports structurés pour l'analyse, permettant de générer des rapports techniques pilotés par l'IA.

Dernières ressources sur l'IAMise à jour il y a 5 mois Cercle de partage de l'IA

11.6K 00

Introduction générale

Il s'agit d'un projet de génération de rapports structurés co-développé par LangChain et NVIDIA, présenté dans un tutoriel Jupyter notebook sur GitHub. Le projet s'appuie sur des techniques d'IA avancées, en particulier le modèle Llama-3.3-70b, pour automatiser la génération de rapports techniques professionnels. La caractéristique principale du projet est un système de génération de rapports en plusieurs étapes construit à l'aide de LangGraph de LangChain, comprenant la planification du rapport, la recherche sur le web et la rédaction du contenu. Le système est capable de planifier automatiquement les chapitres d'un rapport sur la base de sujets définis par l'utilisateur et de schémas structurels, d'effectuer des recherches intelligentes sur le web pour trouver des informations pertinentes grâce à Tavily, et de générer des rapports techniques clairement structurés et rédigés de manière professionnelle. Le projet est particulièrement adapté aux développeurs et aux équipes techniques qui ont besoin de produire rapidement des documents techniques de haute qualité.

Recommandé :STORM : recherche de données sur le web sur la base de thèmes, génération d'articles avec citations, rapports d'articles longs

NVIDIA联合LangChain推出：分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

Liste des fonctions

Planification automatisée de la structure des rapports : génération d'ébauches de rapports sur la base des informations fournies par l'utilisateur sur les sujets et les exigences organisationnelles.
Recherche intelligente sur le web : recherche ciblée sur le web et collecte d'informations à l'aide de l'API Tavily
Traitement parallèle des chapitres du rapport : permet la recherche et la rédaction simultanées de plusieurs chapitres.
Personnalisation souple des rapports : recherche d'actualités ou de contenu général à la demande
Contrôle des sorties structurées : prise en charge des tableaux, des listes et d'autres formats de langage de balisage
Suivi des citations de sources : collecte et formatage automatiques des sources de référence
Mécanismes de contrôle de la qualité : y compris les limites de mots et les contrôles de formatage
Environnement de développement interactif : implémentation complète du carnet Jupyter

Utiliser l'aide

1. préparation à l'environnement

Installer les paquets de dépendances nécessaires :

%pip install --quiet -U langgraph langchain_community langchain_core tavily-python langchain_nvidia_ai_endpoints

Configurez la clé API :

Clé API pour l'essai de NVIDIA NIM
- entretiensPage NVIDIA NIMS'enregistrer et obtenir une clé API
- 1 000 crédits d'essai API pour les nouveaux utilisateurs
Clé API LangChain
- existentPage des paramètres de LangChainCréer un compte
- Naviguez vers "API Keys" pour créer une nouvelle clé API.
Tavily Clé API
- entretiensAccueil Tavilycréer un compte
- Création d'une clé API

2. initialisation du projet

Définition des variables d'environnement :

Python

import os
os.environ["NVIDIA_API_KEY"] = "your-nvidia-api-key"
os.environ["LANGCHAIN_API_KEY"] = "your-langchain-api-key"
os.environ["TAVILY_API_KEY"] = "your-tavily-api-key"

Initialiser les clients nécessaires :

Python

from tavily import TavilyClient, AsyncTavilyClient
tavily_client = TavilyClient()
tavily_async_client = AsyncTavilyClient()

3. le processus de génération de rapports

Définir la structure hiérarchique :

Python

report_structure = """
This report type focuses on comparative analysis.
The report structure should include:
1. Introduction
2. Main Body Sections
3. Conclusion with Comparison Table
"""

Définir le thème du rapport :

Python

report_topic = "你的报告主题"

Configurer les paramètres de recherche :

Python

tavily_topic = "general"  # 或 "news"
tavily_days = None  # 仅适用于新闻主题

Générer un plan de rapport :

Python

sections = await generate_report_plan({
"topic": report_topic,
"report_structure": report_structure,
"number_of_queries": 2,
"tavily_topic": tavily_topic,
"tavily_days": tavily_days
})

4. utilisation des fonctions avancées

Génération de requêtes personnalisées :

Modifier les instructions de query_writer pour optimiser les requêtes de recherche
Ajustez le paramètre number_of_queries pour contrôler le nombre de requêtes par section.

Contrôle de la mise en forme du contenu :

Utiliser la syntaxe Markdown pour définir la hiérarchie des en-têtes
Prise en charge des contenus structurés tels que les tableaux et les listes
Vous pouvez contrôler la limite de mots pour chaque chapitre

Gestion du contenu des sources :

Traitement des résultats de recherche à l'aide de la fonction deduplicate_and_format_sources
Le paramètre max_tokens_per_source peut être ajusté pour contrôler la longueur du contenu de la source.

Optimisation du traitement parallèle :

Recherche parallèle de plusieurs chapitres à l'aide de LangGraph
Optimiser le flux de traitement en ajustant la configuration du StateGraph

5) Précautions

Restrictions d'utilisation de l'API :

Veillez à surveiller la quantité d'API NVIDIA utilisée.
Réglage raisonnable de la fréquence d'interrogation afin d'éviter tout dépassement de la limite.

Contrôle de la qualité du contenu :

Veiller à ce que la structure du rapport fournisse des indications claires sur les sections.
Valider régulièrement l'exactitude du contenu généré

Exigences du système :

Assurer la compatibilité de la version de l'environnement Python
Maintenir les dépendances à jour

Gestion des erreurs :

Mettre en œuvre des mécanismes appropriés de traitement des erreurs
Sauvegarder les résultats intermédiaires pour éviter les interruptions de traitement