NVIDIA и LangChain запускают: продвинутое руководство по написанию структурированных отчетов для аналитики, позволяющее создавать технические отчеты на основе искусственного интеллекта

Общее введение

Это проект по созданию структурированных отчетов, разработанный совместно LangChain и NVIDIA и представленный в учебнике Jupyter notebook на GitHub. Проект использует передовые методы искусственного интеллекта, в частности модель Llama-3.3-70b, для автоматизации создания профессиональных технических отчетов. Основной особенностью проекта является многоступенчатая система создания отчетов, построенная с использованием LangChain's LangGraph, включающая планирование отчета, веб-исследование и написание контента. Система способна автоматически планировать главы отчета на основе заданных пользователем тем и структурных схем, осуществлять интеллектуальный поиск нужной информации в Интернете с помощью Tavily и генерировать четко структурированные, профессионально написанные технические отчеты. Проект особенно подходит для разработчиков и технических команд, которым необходимо быстро создавать высококачественные технические документы.

Рекомендуем:STORM: поиск данных в Интернете по темам, генерация статей с цитатами, длинные отчеты о статьях

NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

 

Список функций

  • Автоматизированное планирование структуры отчетов: создание контуров отчетов на основе введенных пользователем тем и организационных требований
  • Интеллектуальные веб-исследования: целенаправленный поиск и сбор информации в Интернете с помощью Tavily API
  • Параллельная обработка глав отчета: поддерживает одновременное исследование и написание нескольких глав
  • Гибкая настройка отчетов: поиск новостей или общего контента по запросу
  • Управление структурированным выводом: поддержка таблиц, списков и других форматов языка разметки
  • Отслеживание цитирования источников: автоматический сбор и форматирование ссылок на источники
  • Механизмы контроля качества: включая ограничения по количеству слов и проверку форматирования
  • Интерактивная среда разработки: полная реализация блокнота Jupyter

 

Использование помощи

1. Подготовка окружающей среды

  1. Установите необходимые пакеты зависимостей:
%pip install --quiet -U langgraph langchain_community langchain_core tavily-python langchain_nvidia_ai_endpoints
  1. Настройте ключ API:
  • NVIDIA NIM Trial API Key
    • интервьюСтраница NVIDIA NIMЗарегистрируйтесь и получите ключ API
    • 1 000 пробных кредитов API для новых пользователей
  • Ключ API LangChain
  • Tavily Ключ API
    • интервьюДом Тавилизарегистрировать аккаунт
    • Создание ключа API

2. Инициализация проекта

  1. Установка переменных окружения:

Python

import os
os.environ["NVIDIA_API_KEY"] = "your-nvidia-api-key"
os.environ["LANGCHAIN_API_KEY"] = "your-langchain-api-key"
os.environ["TAVILY_API_KEY"] = "your-tavily-api-key"
  1. Инициализируйте необходимые клиенты:

Python

from tavily import TavilyClient, AsyncTavilyClient
tavily_client = TavilyClient()
tavily_async_client = AsyncTavilyClient()

3. Процесс создания отчета

  1. Определите структуру отчетности:

Python

report_structure = """
This report type focuses on comparative analysis.
The report structure should include:
1. Introduction
2. Main Body Sections
3. Conclusion with Comparison Table
"""
  1. Установите тему отчета:

Python

report_topic = "你的报告主题"
  1. Настройте параметры поиска:

Python

tavily_topic = "general"  # 或 "news"
tavily_days = None  # 仅适用于新闻主题
  1. Создайте план отчета:

Python

sections = await generate_report_plan({
"topic": report_topic,
"report_structure": report_structure,
"number_of_queries": 2,
"tavily_topic": tavily_topic,
"tavily_days": tavily_days
})

4. Использование расширенных функций

  1. Формирование пользовательских запросов:
  • Измените инструкции query_writer_instructions для оптимизации поисковых запросов
  • Настройте параметр number_of_queries, чтобы управлять количеством запросов на раздел
  1. Контроль форматирования содержимого:
  • Использование синтаксиса Markdown для установки иерархии заголовков
  • Поддержка структурированного содержимого, такого как таблицы и списки
  • Вы можете контролировать лимит слов для каждой главы
  1. Управление исходным контентом:
  • Обработка результатов поиска с помощью функции deduplicate_and_format_sources
  • Параметр max_tokens_per_source может быть настроен для управления длиной исходного содержимого
  1. Оптимизация параллельной обработки данных:
  • Параллельное исследование нескольких глав с помощью LangGraph
  • Оптимизируйте поток обработки, изменяя конфигурацию StateGraph

5. предостережения

  1. Ограничения на использование API:
  • Внимательно следите за количеством использования NVIDIA API
  • Разумная установка частоты запросов во избежание превышения лимита
  1. Контроль качества контента:
  • Убедитесь, что структура_отчета содержит четкие указания по разделам
  • Регулярно проверяйте точность созданного контента
  1. Системные требования:
  • Обеспечьте совместимость версий окружения Python
  • Поддерживайте зависимости в актуальном состоянии
  1. Обработка ошибок:
  • Реализуйте соответствующие механизмы обработки ошибок
  • Сохраняйте промежуточные результаты, чтобы избежать прерывания обработки
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...