NVIDIA y LangChain lanzan una guía avanzada para redactar informes estructurados de análisis que permite generar informes técnicos basados en IA.

Últimos recursos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

Introducción general

Se trata de un proyecto de generación de informes estructurados desarrollado conjuntamente por LangChain y NVIDIA, presentado en un tutorial de Jupyter notebook en GitHub. El proyecto aprovecha técnicas avanzadas de IA, en concreto el modelo Llama-3.3-70b, para automatizar la generación de informes técnicos profesionales. La característica principal del proyecto es un sistema de generación de informes en varias fases construido con LangGraph de LangChain, que incluye la planificación de informes, la investigación web y la redacción de contenidos. El sistema es capaz de planificar automáticamente capítulos de informes basados en temas y esquemas estructurales definidos por el usuario, realizar búsquedas inteligentes en la web de información relevante a través de Tavily y generar informes técnicos claramente estructurados y redactados de forma profesional. El proyecto es especialmente adecuado para desarrolladores y equipos técnicos que necesitan generar rápidamente documentos técnicos de alta calidad.

NVIDIA联合LangChain推出：分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

Lista de funciones

Planificación automatizada de la estructura de los informes: generación de esquemas de informes basados en la introducción de temas y requisitos organizativos por parte del usuario.
Investigación web inteligente: búsqueda web selectiva y recopilación de información mediante la API Tavily
Procesamiento paralelo de capítulos de informes: permite investigar y redactar varios capítulos simultáneamente.
Personalización flexible de los informes: búsqueda de noticias o contenidos generales a la carta
Control de salida estructurada: compatibilidad con tablas, listas y otros formatos de lenguaje de marcado.
Seguimiento de citas de fuentes: recopilación y formateo automáticos de fuentes de referencia
Mecanismos de control de calidad: límites de palabras y comprobación del formato.
Entorno de desarrollo interactivo: implementación completa del cuaderno Jupyter

Utilizar la ayuda

1. Preparación medioambiental

Instale los paquetes de dependencias necesarios:

%pip install --quiet -U langgraph langchain_community langchain_core tavily-python langchain_nvidia_ai_endpoints

Configure la clave API:

Clave API NVIDIA NIM Trial
- entrevistasPágina NVIDIA NIMRegístrese y obtenga la clave API
- 1.000 créditos de prueba API para nuevos usuarios
Clave API de LangChain
- existePágina de configuración de LangChainCrear una cuenta
- Vaya a "Claves API" para crear una nueva clave API.
Tavily Clave API
- entrevistasCasa Tavilyregistrar una cuenta
- Creación de una clave API

2. Inicialización del proyecto

Configuración de variables de entorno:

Python

import os
os.environ["NVIDIA_API_KEY"] = "your-nvidia-api-key"
os.environ["LANGCHAIN_API_KEY"] = "your-langchain-api-key"
os.environ["TAVILY_API_KEY"] = "your-tavily-api-key"

Inicialice los clientes necesarios:

Python

from tavily import TavilyClient, AsyncTavilyClient
tavily_client = TavilyClient()
tavily_async_client = AsyncTavilyClient()

3. Proceso de generación de informes

Definir la estructura de informes:

Python

report_structure = """
This report type focuses on comparative analysis.
The report structure should include:
1. Introduction
2. Main Body Sections
3. Conclusion with Comparison Table
"""

Establecer el tema del informe:

Python

report_topic = "你的报告主题"

Configure los parámetros de búsqueda:

Python

tavily_topic = "general"  # 或 "news"
tavily_days = None  # 仅适用于新闻主题

Generar un plan de informes:

Python

sections = await generate_report_plan({
"topic": report_topic,
"report_structure": report_structure,
"number_of_queries": 2,
"tavily_topic": tavily_topic,
"tavily_days": tavily_days
})

4. Utilización de funciones avanzadas

Generación de consultas personalizadas:

Modificar query_writer_instructions para optimizar las consultas de búsqueda
Ajuste el parámetro number_of_queries para controlar el número de consultas por sección

Control del formato del contenido:

Uso de la sintaxis Markdown para establecer la jerarquía de encabezados
Compatibilidad con contenidos estructurados, como tablas y listas
Puede controlar el límite de palabras de cada capítulo

Gestión de contenidos en origen:

Procesamiento de los resultados de búsqueda mediante la función deduplicate_and_format_sources
El parámetro max_tokens_per_source puede ajustarse para controlar la longitud del contenido fuente