Dify выпускает Agent Node: внедрение возможностей автономного принятия решений в рабочий процесс
Автоматизация рабочих процессов переживает новую волну изменений в условиях стремительно меняющихся технологий искусственного интеллекта. В течение длительного времениТрадиционные автоматизированные процессыПолагаться на заранее заданные фиксированные движения, которые растягиваются при решении сложных задач, - все равно что просить пианиста механически играть только музыкальную партитуру, что лишает его гибкости и креативности.
Однако с быстрым совершенствованием возможностей рассуждений в рамках моделирования на большом языке (LLM) стало возможным постепенно передавать LLM полномочия по принятию решений для определенных частей рабочего процесса. Недавно платформа Dify официально запустила плагин Agent node Strategy type - инновационную функцию, призванную обеспечить пользователям более интеллектуальную и автономную автоматизацию рабочего процесса.
Взаимосвязь между узлами агента и стратегией: раздельное проектирование, гибкая модернизация
DifyРабочий процесс Основная роль узлов агентов в LLM заключается в разрушении жесткости традиционных рабочих процессов, так что определенные аспекты больше не ограничиваются фиксированными процессами и шаблонами инструментов. Вместо этого узлы агентов позволяют LLM принимать автономные решения и суждения в определенных точках процесса, таким образом реагируя на более сложные и динамичные требования задач.
Чтобы обеспечить гибкость и масштабируемость узлов агента, Dify представляет Стратегия агента (Стратегия агента - это расширяемый шаблон, определяющий стандартизированный входной контент и выходные форматы. Благодаря разработке специальных интерфейсов конфигурации агентских стратегий, Dify позволяет пользователям применять продвинутые агентские стратегии, такие как CoT (Chain of Thought), ToT (Thinking Tree), GoT (Thinking Map) и BoT (Thinking Pillar), и даже более сложные стратегии семантического ядра.
В платформе Dify узлы Agent содержат стратегию Agent Strategy и тесно связаны с узлами, расположенными выше и ниже по течению рабочего процесса. Подобно узлам LLM, узлы агентов сосредоточены на решении конкретных задач и передают конечные результаты узлам нижнего уровня.
Чтобы лучше понять взаимосвязь между узлами агента и стратегией агента, можно провести аналогию с двигателем и системой управления автомобиля:
- Агентский узел (исполнительное устройство): Действует как "центр принятия решений" в рабочем процессе, планируя ресурсы, управляя оперативным состоянием и документируя весь процесс обоснования.
- Стратегия агента (логика принятия решений): Как подключаемый модуль алгоритмов рассуждений, Agent Strategy определяет правила использования инструментов и парадигм решения задач.
Такая тонкая схема разделения позволяет разработчикам самостоятельно обновлять "систему питания" (стратегию агентов) без существенных изменений всей архитектуры рабочего процесса, что значительно повышает гибкость и ремонтопригодность системы.
В настоящее время Dify поставляется с двумя классическими политиками Agent Strategy, из которых пользователи могут выбирать:
- ReAct: Классическая цепочка рассуждений "думать - действовать - наблюдать", которая имитирует человеческие мысли и действия.
- Вызов функции: Поддерживаются функциональные точные вызовы, позволяющие точно обращаться к внешним инструментам или API.
Пользователи могут загрузить эти предустановленные стратегии прямо из Dify Marketplace и быстро применить их в своих рабочих процессах. Более того, Dify внедрила открытый стандарт разработки стратегий, который поощряет разработчиков к совместной работе для создания процветающей экосистемы агентских стратегий. На платформе Dify любой разработчик может:
- Быстрое создание плагинов пользовательских политик с помощью инструмента CLI.
- Формы конфигурации и компоненты визуализации для пользовательских политик.
- Интеграция передовых академических алгоритмов (например, Tree-of-Thoughts) в узлы агентов.
Это означает, что Dify становится "инновационной платформой" для стратегий выводов ИИ, где каждый пользователь может участвовать в совместном создании сообщества и пользоваться его плодами.
Обзор функциональных возможностей узла агента
Функциональная панорама показывает основные функции узла Agent.

В следующем разделе мы расскажем о специфике использования и преимуществах узлов Agent для обычных пользователей и разработчиков, соответственно.
Для обычных пользователей: перетаскивание, прозрачные рассуждения
1. Перетаскивание для быстрой настройки
Платформа Dify сводит к минимуму препятствия для использования узлов Agent. Пользователи могут перетаскивать узлы Агента непосредственно на холст рабочего процесса с панели инструментов и настраивать их в три простых шага:
- стратегия выборочного вывода: Выберите подходящую стратегию агента из списка предварительно настроенных или пользовательских стратегий.
- Инструменты/модели для переплета: Привяжите узел агента к нужному инструменту или языковой модели.
- Настройка шаблона напоминания: Создайте шаблон четких подсказок, которые будут направлять рассуждения и принятие решений LLM в соответствии с требованиями задачи.

2. Прозрачный процесс рассуждений, ведение журнала в режиме реального времени
Мощной особенностью агентной стратегии Dify является встроенный механизм протоколирования. Этот механизм создает древовидную структуру мыслительного процесса агента, позволяя визуализировать путь его выполнения и облегчая отладку сложных многоэтапных рассуждений.

Журналы в реальном времени дают пользователю четкое представление о ситуации:
- Общее время / расход токенов: Понимание потребления ресурсов узлом агента.
- мыслительный процесс мультираунда: Проследите несколько раундов размышлений и шагов принятия решений LLM.
- Траектория вызова инструмента: Контролирует протоколирование вызовов узла агента к внешним инструментам.
Прозрачный процесс рассуждений и журнальная информация в реальном времени значительно повышают отлаживаемость и интерпретируемость узлов агента, помогая пользователям лучше понять и оптимизировать рабочие процессы.
Для разработчиков: стандартизированная разработка, гибкая настройка
Для разработчиков Dify предоставляет стандартизированный набор средств разработки, позволяющий быстро создавать и настраивать агентские стратегии. В основе определения агентской стратегии лежит определение следующих модулей, которые определяют, как работает языковая модель:
- Обработка запросов пользователей: Получение и разбор запросов на естественном языке от пользователей.
- Выбор правильного инструмента: Выберите подходящий инструмент в соответствии с содержанием запроса и требованиями задачи.
- Используйте правильный инструмент для реализации параметров: Вызывает выбранный инструмент с правильными параметрами.
- Инструмент обработки возвращает результаты: Парсинг и обработка результатов, полученных при выполнении инструмента.
- Определение времени выполнения задания: Определите, когда задание будет выполнено, и выведите окончательный ответ.

Стандартизированный набор средств разработки, содержащий библиотеку компонентов конфигурации политики (например, Model Selector / Tool Editor и т. д.), структурированные интерфейсы протоколирования и среду тестирования "песочница", упрощает процесс разработки политики.
Определение политики состоит в основном из идентификационных и метаданных политики, необходимых параметров (например, моделей, инструментов, запросов и т. д.), типов и ограничений параметров, а также местоположения исходного кода реализации политики.
Процесс выполнения агента делится на три основные фазы: инициализация, итерационный цикл и окончательный ответ.
- этап инициализации: Система завершает настройку необходимых параметров, настройку инструмента и подготовку контекста.
- стадия итеративного цикла: Система подготавливает запрос, содержащий текущий контекст, и использует информацию об инструментах для вызова Большой языковой модели (LLM). Затем система анализирует ответ от LLM, чтобы определить, был ли вызван инструмент или получен окончательный ответ. Если требуется вызов инструмента, система запускает соответствующий инструмент и обновляет контекст, используя результаты работы инструмента. Этот цикл продолжается до тех пор, пока задача не будет выполнена или не будет достигнуто заданное максимальное количество итераций.
- этап окончательного ответа: Система возвращает окончательный ответ или результат.
Платформа Dify поддерживает декларативное определение политик с помощью файлов YAML. Например, следующий код иллюстрирует политику с именем function_calling.yaml
Пример файла конфигурации для
parameters:
- name: model
type: model-selector
scope: tool-call&llm
- name: tools
type: array[tools]
- name: max_iterations
type: number
default: 5
extra:
python:
source: function_calling.py
Декларативная архитектура делает настройку политики такой же простой и интуитивно понятной, как заполнение формы, и при этом поддерживает ее:
- Динамическая калибровка параметров: Динамическая проверка типов, областей и зависимостей параметров.
- Автоматическое отображение многоязычных надписей: Интерфейс конфигурации для автоматического отображения мультиязычных версий.
Для получения более подробной информации об определениях политики обратитесь к официальной документации Dify: https://docs.dify.ai/plugins/schema-definition/agent.
Перспективы будущего: непрерывная итерация, бесконечные возможности
В будущем платформа Dify планирует продолжить работу над функциональностью узла Agent и, например, добавить больше библиотек компонентов, ориентированных на разработчиков:
- Возможность доступа к базе знаний
- Компонент памяти в Chatflow
- Механизмы обработки ошибок и повторных попыток
- Больше официальных агентских стратегий

Пользователи могут загружать различные стратегии агентов из сообщества и загружать их в различные узлы агентов для решения различных сложных задач в соответствии с их потребностями.
При первом знакомстве с узлами Agent пользователи могут использовать трехузловой Chatflow, чтобы получить быстрый обзор их работы и смоделировать базовые возможности Agent. При решении более сложных задач попробуйте продвинутые методы, такие как маршрутизация и передачи, и рассматривайте узел Agent как мощное расширение узла LLM, решающего сложные проблемы пошагово.
Например, с помощью узлов Agent пользователи могут получить возможности обработки сложных задач, подобные OpenAI ChatGPT-4o with Task (изображение ниже от участника сообщества Паскаля).

Более продвинутый геймплей будет официально выпущен в Dify 1.0.0, а разработчики могут внести свой вклад в стратегию агентов, чтобы вместе построить процветающую экосистему Dify!
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...