NVIDIA и LangChain запускают: продвинутое руководство по написанию структурированных отчетов для аналитики, позволяющее создавать технические отчеты на основе искусственного интеллекта
Общее введение
Это проект по созданию структурированных отчетов, разработанный совместно LangChain и NVIDIA и представленный в учебнике Jupyter notebook на GitHub. Проект использует передовые методы искусственного интеллекта, в частности модель Llama-3.3-70b, для автоматизации создания профессиональных технических отчетов. Основной особенностью проекта является многоступенчатая система создания отчетов, построенная с использованием LangChain's LangGraph, включающая планирование отчета, веб-исследование и написание контента. Система способна автоматически планировать главы отчета на основе заданных пользователем тем и структурных схем, осуществлять интеллектуальный поиск нужной информации в Интернете с помощью Tavily и генерировать четко структурированные, профессионально написанные технические отчеты. Проект особенно подходит для разработчиков и технических команд, которым необходимо быстро создавать высококачественные технические документы.
Рекомендуем:STORM: поиск данных в Интернете по темам, генерация статей с цитатами, длинные отчеты о статьях

Список функций
- Автоматизированное планирование структуры отчетов: создание контуров отчетов на основе введенных пользователем тем и организационных требований
- Интеллектуальные веб-исследования: целенаправленный поиск и сбор информации в Интернете с помощью Tavily API
- Параллельная обработка глав отчета: поддерживает одновременное исследование и написание нескольких глав
- Гибкая настройка отчетов: поиск новостей или общего контента по запросу
- Управление структурированным выводом: поддержка таблиц, списков и других форматов языка разметки
- Отслеживание цитирования источников: автоматический сбор и форматирование ссылок на источники
- Механизмы контроля качества: включая ограничения по количеству слов и проверку форматирования
- Интерактивная среда разработки: полная реализация блокнота Jupyter
Использование помощи
1. Подготовка окружающей среды
- Установите необходимые пакеты зависимостей:
%pip install --quiet -U langgraph langchain_community langchain_core tavily-python langchain_nvidia_ai_endpoints
- Настройте ключ API:
- NVIDIA NIM Trial API Key
- интервьюСтраница NVIDIA NIMЗарегистрируйтесь и получите ключ API
- 1 000 пробных кредитов API для новых пользователей
- Ключ API LangChain
- существоватьСтраница настроек LangChainСоздать учетную запись
- Перейдите в раздел "Ключи API", чтобы создать новый ключ API.
- Tavily Ключ API
- интервьюДом Тавилизарегистрировать аккаунт
- Создание ключа API
2. Инициализация проекта
- Установка переменных окружения:
Python
import os
os.environ["NVIDIA_API_KEY"] = "your-nvidia-api-key"
os.environ["LANGCHAIN_API_KEY"] = "your-langchain-api-key"
os.environ["TAVILY_API_KEY"] = "your-tavily-api-key"
- Инициализируйте необходимые клиенты:
Python
from tavily import TavilyClient, AsyncTavilyClient
tavily_client = TavilyClient()
tavily_async_client = AsyncTavilyClient()
3. Процесс создания отчета
- Определите структуру отчетности:
Python
report_structure = """
This report type focuses on comparative analysis.
The report structure should include:
1. Introduction
2. Main Body Sections
3. Conclusion with Comparison Table
"""
- Установите тему отчета:
Python
report_topic = "你的报告主题"
- Настройте параметры поиска:
Python
tavily_topic = "general" # 或 "news"
tavily_days = None # 仅适用于新闻主题
- Создайте план отчета:
Python
sections = await generate_report_plan({
"topic": report_topic,
"report_structure": report_structure,
"number_of_queries": 2,
"tavily_topic": tavily_topic,
"tavily_days": tavily_days
})
4. Использование расширенных функций
- Формирование пользовательских запросов:
- Измените инструкции query_writer_instructions для оптимизации поисковых запросов
- Настройте параметр number_of_queries, чтобы управлять количеством запросов на раздел
- Контроль форматирования содержимого:
- Использование синтаксиса Markdown для установки иерархии заголовков
- Поддержка структурированного содержимого, такого как таблицы и списки
- Вы можете контролировать лимит слов для каждой главы
- Управление исходным контентом:
- Обработка результатов поиска с помощью функции deduplicate_and_format_sources
- Параметр max_tokens_per_source может быть настроен для управления длиной исходного содержимого
- Оптимизация параллельной обработки данных:
- Параллельное исследование нескольких глав с помощью LangGraph
- Оптимизируйте поток обработки, изменяя конфигурацию StateGraph
5. предостережения
- Ограничения на использование API:
- Внимательно следите за количеством использования NVIDIA API
- Разумная установка частоты запросов во избежание превышения лимита
- Контроль качества контента:
- Убедитесь, что структура_отчета содержит четкие указания по разделам
- Регулярно проверяйте точность созданного контента
- Системные требования:
- Обеспечьте совместимость версий окружения Python
- Поддерживайте зависимости в актуальном состоянии
- Обработка ошибок:
- Реализуйте соответствующие механизмы обработки ошибок
- Сохраняйте промежуточные результаты, чтобы избежать прерывания обработки
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...