Agent Inbox: интерфейс управления для взаимодействия человека и компьютера с искусственным интеллектом
Общее введение
Agent Inbox - это проект с открытым исходным кодом, разработанный командой LangChain для обеспечения нового пользовательского опыта взаимодействия с ИИ-интеллектами. Проект позволяет пользователям управлять и оптимизировать взаимодействие с несколькими ИИ-интеллектами через централизованный интерфейс. Agent Inbox поддерживает широкий спектр опций конфигурации и настройки, позволяя пользователям адаптировать поведение и отзывчивость агентов к своим потребностям. Цель проекта - упростить процесс управления ИИ-интеллектами, повысить эффективность взаимодействия и обеспечить более интуитивный пользовательский опыт.
Размещенная в Интернете версия: dev.agentinbox.ai


Список функций
- централизованное управление: Управление взаимодействием нескольких искусственных интеллектов через единый интерфейс.
- Пользовательская конфигурация: Поддерживаются различные варианты конфигурации, позволяющие пользователям настраивать поведение агента в соответствии со своими потребностями.
- реагирование в режиме реального времени: Обеспечивает регистрацию ответов и взаимодействий агентов в режиме реального времени.
- Поддержка нескольких языков: Поддерживает режимы ввода и вывода прерываний для нескольких языков программирования.
- проект с открытым исходным кодом: Код находится в открытом доступе и может свободно просматриваться, изменяться и дополняться пользователями.
Использование помощи
Процесс установки
- склад клонов::
git clone https://github.com/langchain-ai/agent-inbox.git
cd agent-inbox
- Установка зависимостей::
yarn install
- Настройка ключа API::
- Нажмите кнопку "Настройки" в боковой панели и введите ключ API LangChain.
- Создайте свою первую папку входящих: откройте всплывающее окно "Настройки" (в левом нижнем углу боковой панели), нажмите "Добавить папку входящих" и заполните соответствующую информацию.
Процесс использования
- Начало реализации проектов::
yarn start
- Подключение к развертыванию LangGraph::
- Добавьте имя графа LangGraph или идентификатор помощника.
- Введите URL-адрес развертывания LangGraph.
- Назовите папку входящих сообщений (необязательно).
- Управление прерываниями::
- Обновите все экземпляры кода, использующие прерывания, чтобы они были совместимы с Agent Inbox.
- Определите режимы ввода и вывода прерываний с помощью Python или TypeScript.
Основные функции
- Принятие прерываний: Принимает параметры или действия прерывания и отправляет ActionRequest.
- Редактирование прерывания: Отредактируйте параметры прерывания и отправьте измененный ActionRequest.
- Не обращайте внимания на прерывания: В зависимости от конфигурации, пользователь может выбрать игнорирование прерываний.
- Реагирование на прерывания: Пользователь может реагировать в зависимости от типа прерывания.
Подробная процедура работы
- Настройка режима прерывания::
- Режим прерывания Python:
python
class HumanInterrupt(BaseModel):
action: str
args: Dict[str, Any] - Режим прерывания TypeScript:
typescript
interface HumanInterrupt {
action: string;
args: Record<string, any>;
}
- Режим прерывания Python:
- Отправить ответ::
- В зависимости от типа прерывания отправляется соответствующий ответ HumanResponse:
python
class HumanResponse(BaseModel):
action_request: ActionRequest
- В зависимости от типа прерывания отправляется соответствующий ответ HumanResponse:
Введение в агентов окружающей среды
Большинство современных приложений ИИ следуют общей модели чата (например, ChatGPT). Несмотря на простоту реализации, они несут ненужные накладные расходы на взаимодействие, ограничивают самомасштабируемость человека и не позволяют в полной мере использовать потенциал Большой языковой модели (LLM).
В течение последних шести месяцев мы изучали другой подход в LangChain:Экологические агенты Реагируют на сигналы окружающей среды и требуют ввода данных от пользователя только при обнаружении важной возможности или необходимости обратной связи. Вместо того чтобы заставлять пользователя переходить в новое окно чата, эти агенты помогут вам сосредоточиться на главном.
Мы построили LangGraph чтобы упростить реализацию этих паттернов. Сегодня мы делимся нашей первой эталонной реализацией: aПомощник по электронной почтеОна демонстрирует ключевыеЭкологические агентыШаблоны. В течение следующих нескольких дней мы опубликуем больше примеров и инструментов, которые помогут вам создать свои собственные рабочие процессы по защите окружающей среды.
Что такое экологический агент?
При использовании ChatGPT (или любой другой чатбот), когда они полагаются на вас, чтобы инициировать диалог. Агенты инициируются человеком, отправляющим сообщение.
Это отлично подходит для некоторых случаев использования, но имеет существенные ограничения для других. Чтобы агент мог выполнить свою работу, пользователю необходимо каждый раз заходить в интерфейс чата и отправлять сообщение. Чтобы заставить агента начать работу, требуется много накладных расходов.
Еще одно ограничение заключается в том, что одновременно можно вести только один диалог. Это затрудняет расширение наших возможностей - агент может делать за нас только одну вещь за раз.
Если рассматривать парадигму UX, позволяющую преодолеть эти ограничения, то она должна обладать двумя ключевыми характеристиками:
- Он не должен запускаться (только) человеческими сообщениями
- Он должен обеспечивать одновременную работу нескольких агентов
Эти характеристики определяют то, что мы называем Экологические агенты .
💡Экологические агенты Прослушивание потока событий и принятие соответствующих мер, возможно, для нескольких событий одновременно
Стоит отметить, что мы не считаем, чтоЭкологические агентыдолжна быть полностью автономной. На самом деле, мы считаем, что это будетЭкологические агентыКлючевым моментом в привлечении внимания общественности является продуманность Когда? слишком каким образом Эти агенты взаимодействуют с людьми.
человеко-компьютерное взаимодействие
Мы используемчеловеко-компьютерное взаимодействиеобращаться к этим агентам Когда? слишком каким образом взаимодействие с людьми. К этому мы вернемся позже. каким образом Но теперь давайте обсудим Когда? .
Обычно мы видимЭкологические агентыТри общихчеловеко-компьютерное взаимодействиеСпособы: уведомление, вопросы и обзор.
Уведомление: Дайте пользователю знать, что событие важно, но не предпринимайте никаких действий. Это полезно для пометки событий, которые пользователь должен видеть, но у агента нет полномочий действовать в соответствии с ними. В контексте помощника по электронной почте это может быть агент, отмечающий Docusign в моем почтовом ящике - он не может подписать этот Docusign, но я должен знать о его существовании.
Вопрос: Задайте пользователю вопрос, чтобы помочь разблокировать агента. Возможно, агент пытается выполнить какое-то действие, но ему неясно, как лучше его выполнить, потому что ему не хватает какой-то важной информации. Вместо того чтобы галлюцинировать или гадать, лучше, чтобы агент напрямую спросил человека, что ему делать. В контексте помощника по электронной почте это может быть агент, спрашивающий меня, хочу ли я присутствовать на встрече. Если в подсказке нет инструкций для агента о моих предпочтениях в отношении встреч, он не может этого знать. Человеческий советник спросил бы меня, так же должен поступить и агент.
Обзор: Просмотрите действия, которые агент хочет предпринять. Некоторые действия настолько "опасны", что, возможно, стоит жестко закодировать проверку любого действия, которое хочет выполнить агент. Человек может одобрить действие, отредактировать его или предоставить агенту прямую обратную связь о том, как его изменить. В контексте помощника по работе с электронной почтой это может быть исходящее письмо. Он может написать черновик, но я должен одобрить его, непосредственно отредактировать содержимое сообщения или сказать агенту, чтобы он как-то его исправил.
Важность взаимодействия человека и компьютера
Мы считаем, чточеловеко-компьютерное взаимодействиеКомпоненты дляЭкологические агентыдает три ключевых преимущества:
- Это снижает риск и упрощает запуск агентов в производство
- Он имитирует человеческое общение, что позволяет повысить доверие пользователей и добиться их принятия
- Улучшает долговременную память и обучение
HCI снижает риски. Если агент работает полностью автономно в фоновом режиме, он действительно не может совершать ошибок. Вы должны очень доверять агенту, чтобы позволить ему выполнять определенные действия (например, обновлять базы данных, отправлять электронные письма важным клиентам и т. д.). С помощьючеловеко-компьютерное взаимодействиеВы можете легко контролировать эти операции и запрашивать явное одобрение вручную. Таким образом, вы можете быть уверены, что не отправите неправильные письма.
HCI имитирует способ общения между людьми. Важной частью работы с другими людьми является общение с ними. Если вы сомневаетесь, задайте им вопросы и позвольте им помочь вам обдумать идеи. Если у нас есть "коллеги", которые являются доверенными лицами, их общение в аналогичном режиме укрепляет доверие пользователей, что способствует принятию. Подумайте о чем-то вроде Девин Что-то вроде этого. Они выбирают пользователей с Девин Один из основных интерфейсов для взаимодействия - Slack. Именно там мы общаемся с человеческими разработчиками, так почему бы нам не взаимодействовать с разработчиками ИИ таким же образом? Общение - это важно.
Взаимодействие человека и компьютера улучшает долговременную память и обучение. Мы уверены, что ключевой составляющей ИИ-агентов является их способность обучаться и со временем лучше соответствовать человеческим пользователям. Чтобы добиться такого соответствия, им необходима обратная связь с пользователем в той или иной форме. Такой видчеловеко-компьютерное взаимодействиеКомпонент обеспечивает обратную связь.
Входящие прокси
Таким образом, мы обсудили, что агенты должны Когда? Общение с людьми ( уведомления(математика) род задавать вопросы(математика) род подвергать цензуре ), но мы не обсуждали, что они должны каким образом Коммуникация.
на судеЭкологические агентыКогда речь зашла о Slack, мы изначально начали со Slack. Главным преимуществом было то, что мы все уже использовали Slack в повседневной работе, поэтому это был эффективный способ привлечь наше внимание и сосредоточиться на общении с людьми.
Недостаток Slack в том, что легко пропустить все уведомления. Если вы не отвечаете на некоторые уведомления, то их количество растет. Канал Slack (или DM) не самый простой в навигации. Он также имеет ограничения в общении с агентами - вы можете легко отправлять им сообщения, но все остальное сложнее.
Мы обратились к так называемому "прокси-инбоксу". Это то же самое, чтоЭкологические агентыНовый интерактивный UX. Он смоделирован как комбинация почтового ящика и системы тикетов поддержки клиентов. Здесь отображаются все открытые линии связи между вами и агентом, что позволяет легко отследить все невыполненные действия. Это отдельный пользовательский интерфейс, который позволяет легко добавлять любые панели, кнопки или другие функции пользовательского интерфейса, позволяя вам легче собирать отзывы пользователей. В настоящее время элементы сортируются только по времени, но в будущем вы сможете сортировать их по приоритету. В настоящее время эта папка "Входящие" является однопользовательской, но в будущем вы сможете видеть, какие пункты были назначены вам, а какие - другим.

Примечание: реализация прокси-инбокса с открытым исходным кодом будет выпущена в четверг (уже).
Почему LangGraph отлично подходит для агентов по охране окружающей среды
Прежде чем мы построимЭкологические агентыМы убеждаемся, что LangGraph способен поддерживать такие типы агентов. Платформа LangGraph ) обладает некоторыми ключевыми особенностями, которые вы, возможно, не захотите создавать самостоятельно:
встроенныйуровень постоянства. LangGraph поддерживается слоем персистентности, который сохраняет состояние агента между каждой операцией (или узлом графа). Это позволяет агенту по сути "приостанавливаться" и ждать обратной связи от пользователя. Это полезно для обеспечения возможностичеловеко-компьютерное взаимодействиеОчень важны как шаблоны, так и кратковременная диалоговая память.
встроенныйПоддержка человеко-компьютерного взаимодействия. Родная поддержка LangGraphчеловеко-компьютерное взаимодействиеПаттерны. Встроенный слой персистентности является важной частью этого процесса, но недавно мы также добавили "Прерывания". Это новый встроенный метод общения с конечными пользователями.
встроенныйДолговременная память. LangGraph имеет встроенную долговременную память (по сути, хранилище ключей-значений пространства имен с поддержкой семантического поиска). Это позволяет агенту использоватьчеловеко-компьютерное взаимодействиеПосле этого легко обновить его "память".
Задачи Cron. МногиеЭкологические агентыЗапуск по расписанию для проверки новых событий. Платформа LangGraph поставляется со встроенной задачей cron для поддержки этого.
Создание помощника по электронной почте с искусственным интеллектом
Создавая нашу повседневнуюЭкологические агентыМы сделали LangGraph очень удобным для построенияЭкологические агентыОдин из главных - помощник по электронной почте. Один из главных - помощник по электронной почте. Если вы связывались со мной за последние шесть месяцев, велика вероятность, что это письмо составил агент искусственного интеллекта (а если я вас не заметил, то виноват агент искусственного интеллекта).
Сегодня мы запускаем этот почтовый помощник, который одновременно является бесплатным почтовым агентом и проектом с открытым исходным кодом. Мы хотим, чтобы хостинговые почтовые агенты было легко попробовать и испытать!Экологические агентыИ версия с открытым исходным кодом может служить эталонной реализацией этой новой парадигмы проектирования.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...