はじめに
Agent Inboxは、LangChainチームによって開発されたオープンソースプロジェクトで、AIインテリジェンスと対話するための新しいユーザー体験を提供します。このプロジェクトにより、ユーザは一元化されたインターフェイスを通して、複数のAIインテリジェンスとのインタラクションを管理し、最適化することができます。Agent Inboxは、幅広い設定とカスタマイズオプションをサポートし、ユーザがエージェントの動作と応答性をニーズに合わせて調整することを可能にします。このプロジェクトの目標は、AIインテリジェンスの管理プロセスを簡素化し、インタラクションの効率を改善し、より直感的なユーザー体験を提供することです。
オンラインホスト版:dev.agentinbox.ai
機能一覧
- 集中管理複数のAI知能の相互作用を単一のインターフェースで管理する。
- カスタム設定様々なコンフィギュレーションオプションがサポートされており、ユーザーは必要に応じてエージェントの動作を調整することができます。
- リアルタイム応答エージェントのレスポンスとインタラクションをリアルタイムでロギングします。
- 多言語サポート複数のプログラミング言語に対応した割り込み入出力モードをサポート。
- オープンソースプロジェクトコードは公開されており、ユーザーが自由に閲覧、修正、貢献することができる。
ヘルプの使用
設置プロセス
- クローン倉庫::
git clone https://github.com/langchain-ai/agent-inbox.git
cd agent-inbox
- 依存関係のインストール::
ヤーンインストール
- APIキーの設定::
- サイドバーの "設定 "ボタンをクリックし、LangChain APIキーを入力します。
- 最初の受信トレイを作成する:設定ポップアップウィンドウ(サイドバーの左下)を開き、「受信トレイを追加」をクリックし、関連情報を入力します。
使用プロセス
- プロジェクトの開始::
ヤーンスタート
- LangGraphデプロイメントへの接続::
- LangGraphグラフ名またはヘルパーIDを追加する。
- LangGraphデプロイのURLを入力します。
- 受信箱に名前を付ける(オプション)。
- 中断の管理::
- 割り込みを使用するコード内のすべてのインスタンスをAgent Inboxと互換性があるように更新します。
- PythonやTypeScriptを使って、割り込みの入出力モードを定義する。
主な機能
- 中断の受け入れ割り込みのパラメータまたはアクションを受け付け、ActionRequestを送信する。
- 割り込み編集割り込みのパラメータを編集し、変更したActionRequestを送信する。
- 中断を無視する設定によっては、割り込みを無視することもできる。
- 中断への対応割り込みの種類に応じて対応できる。
詳しい操作手順
- 割り込みモードの設定::
- Python 割り込みモード:
パイソン
クラス HumanInterrupt(BaseModel).
action: str
args: Dict[str, Any].
- TypeScriptの割り込みモード:
タイプスクリプト
interface HumanInterrupt { インターフェース
action: 文字列;
args: Record;
}
- Python 割り込みモード:
- 応答を送信::
- 割り込みの種類に応じて、適切なHumanResponseが送信される:
パイソン
クラス HumanResponse(BaseModel).
action_request: ActionRequest
- 割り込みの種類に応じて、適切なHumanResponseが送信される:
アンビエント・エージェントの紹介
現在のAIアプリケーションのほとんどは、一般的なチャットモデル(ChatGPTなど)に従っている。実装は簡単ですが、不必要なインタラクションのオーバーヘッドが発生し、人間の自己拡張性を制限し、大規模言語モデル(LLM)の可能性をフルに活用することができません。
この半年間、LangChainでは異なるアプローチを模索してきた:環境保護剤 環境シグナルに反応し、重要な機会が検出された時やフィードバックが必要な時のみ、ユーザー入力を要求します。ユーザーを新しいチャットウィンドウに強制的に移動させるのではなく、これらのエージェントは、最も重要なことに集中することを支援します。
私たちはこれらのパターンの実装を簡単にするためにLangGraphを作りました。今日は、私たちの最初のリファレンス実装であるメールアシスタントその重要性を示している。環境保護剤パターン今後数日間で、あなた自身の環境ワークフローを構築するのに役立つ、より多くの例やツールを掲載する予定です。
環境エージェントとは何か?
を使用する場合 チャットGPT (または他のチャットボット)が対話を開始する際に、あなたに依存する場合。エージェントは、人間がメッセージを送信することによって開始されます。
これは、いくつかのユースケースには最適ですが、他のユースケースには大きな制限があります。エージェントが仕事をするためには、ユーザーがチャットインターフェースに入り、毎回メッセージを送信する必要があります。エージェントが作業を開始するためには、多くのオーバーヘッドが発生します。
もうひとつの制限は、一度にひとつの対話しかできないことだ。エージェントは一度に一つのことしかできない。
これらの制限を克服するためのUXパラダイムを考えるなら、それは2つの重要な特徴を示すはずだ:
- 人間のメッセージによって(だけ)トリガーされるべきではない。
- 複数のエージェントを同時に実行できるようにする
これらの特徴は、私たちがこう呼ぶものを定義している。 環境保護剤 .
💡環境保護剤 イベント・ストリームに耳を傾け、場合によっては複数のイベントに同時に対応する。
特筆すべきは、我々は次のように考えていないことである。環境保護剤は完全に自律的でなければならない。実際、私たちは次のように考えている。環境保護剤国民へのプッシュの重要な部分は、その思慮深さである。 いつ? も どう これらの薬剤は人間と相互作用する。
ヒューマンコンピュータインタラクション
を使用する。ヒューマンコンピュータインタラクションこれらのエージェントを指す いつ? も どう 人間との交流。それについては後で説明しよう。 どう しかし、ここで議論しよう。 いつ? .
我々は通常、次のように見ている。環境保護剤3つの共通点ヒューマンコンピュータインタラクションモダリティ:通知、質問、レビュー。
お知らせ ユーザにイベントが重要であることを知らせますが、アクションは取りません。これは、ユーザが見るべきイベントにフラグを立てるのに便利です。メールアシスタントのコンテキストでは、エージェントが受信トレイのドキュサインにフラグを立てるようなものです。
質問だ: エージェントのブロックを解除するために、ユーザに質問してください。エージェントは何らかのアクションを起こそうとしているかもしれませんが、関連する情報が不足しているため、どのように実行するのがベストかわかりません。幻覚を見たり推測したりする代わりに、エージェントが人間に直接何をすべきかを尋ねる方が良いでしょう。電子メールアシスタントの文脈では、これはエージェントに会議に出席するかどうか尋ねられるかもしれない。プロンプトがエージェントに対して、私の会議の希望について指示しない限り、エージェントがそれを知ることはありえない。人間のEAなら私に尋ねるだろうし、エージェントもそうすべきだ。
レビュー エージェントが取りたい行動をレビューする。いくつかのアクションは "危険 "なので、エージェントが取りたいアクションのレビューをハードコーディングする価値があるかもしれません。人間がアクションを承認したり、直接編集したり、変更方法についてエージェントに直接フィードバックを提供することができます。メールアシスタントのコンテキストでは、これは送信メールかもしれません。それは下書きを書くかもしれませんが、私はそれを承認するか、メッセージの内容を直接編集するか、何らかの方法でそれを修正するようにエージェントに伝えなければなりません。
人間とコンピューターの相互作用の重要性
我々は次のように考えている。ヒューマンコンピュータインタラクションコンポーネント環境保護剤には3つの利点がある:
- リスクを減らし、エージェントの本番稼動を容易にする
- 人間のコミュニケーションを模倣することで、ユーザーの信頼と採用を築く
- 長期記憶と学習能力を高める
HCIはリスクを軽減する。 エージェントがバックグラウンドで完全に自律的に動作している場合、ミスを犯すことはありません。エージェントに特定のアクション(例えば、データベースの更新、重要な顧客へのメール送信など)を取らせるためには、エージェントをかなり信頼しなければなりません。とヒューマンコンピュータインタラクションこのような操作を簡単に制御し、明示的な手動承認を求めることができます。このようにして、間違ったメールを送信しないようにすることができます。
HCIは人間のコミュニケーション方法を模倣している。 他人と仕事をする上で重要なのは、コミュニケーションをとることである。躊躇しているときは、彼らに質問し、アイデアを考える手助けをしてもらおう。代理人である「同僚」がいれば、彼らに同じようなモードでコミュニケーションをとってもらうことで、ユーザーの信頼が築かれ、採用が促進される。次のようなことを考えてみよう。 デヴィン こんな感じだ。彼らは デヴィン 人間の開発者と交流する場であるSlackで、AI開発者と交流してはどうだろう?コミュニケーションは重要だ。
人間とコンピュータの相互作用は長期記憶と学習を強化する。 私たちは、AIエージェントの重要な部分は、時間の経過とともに学習し、人間のユーザーとの整合性を高めていく能力であると強く信じています。この一貫性を達成するためには、何らかの形でユーザーからのフィードバックが必要です。このようなヒューマンコンピュータインタラクションコンポーネントはこのフィードバックを提供する。
プロキシ受信箱
従って、エージェントは次のように考えるべきである。 いつ? 人間とのコミュニケーション 通知属 質問をする属 検閲 )であるべきだという議論はしなかった。 どう コミュニケーション。
試験中環境保護剤Slackに関しては、最初はSlackから始めた。主な利点は、私たち全員が日常業務ですでにSlackを使っていたので、私たちの注意を引き、人間とのコミュニケーションに集中するための効果的な方法だったことです。
Slackの欠点は、すべての通知を見逃しやすいことだ。Slackのチャンネル(またはDM)はナビゲートしやすいとは言えません。Slackチャンネル(またはDM)は、最も簡単に操作できるものではありません。また、エージェントとのコミュニケーション方法にも制限があります。
私たちは「プロキシ受信箱」と呼ぶものに目をつけた。これは環境保護剤インタラクティブな新しいUX。メールボックスとカスタマーサポートチケットシステムを組み合わせてモデル化されています。お客様とエージェント間のすべてのオープンなコミュニケーションが表示され、未解決のアクションを簡単に追跡することができます。スタンドアロンUIなので、パネルやボタン、その他のUI機能を簡単に追加することができ、より簡単にユーザーフィードバックを取得することができます。現在、項目は時間順でしか並べ替えられませんが、将来的には優先度順で並べ替えられるようになります。現在、この受信トレイはシングルプレイヤーですが、将来的には、どのアイテムが自分に割り当てられ、どのアイテムが他の人に割り当てられたかを確認できるようになります。
ラングラフが環境エージェントに最適な理由
を作る前に環境保護剤私たちはLangGraphがこのようなタイプのエージェントをサポートできるようにしています。 ラングラフ・プラットフォーム )には、自分では作りたくないような重要な機能がいくつかある:
内蔵永続層. LangGraphは、各操作(またはグラフのノード)の間のエージェントの状態を保持する永続層によって支えられています。これにより、エージェントは基本的に "一時停止 "し、ユーザからのフィードバックを待つことができます。これはヒューマンコンピュータインタラクションパターンだけでなく、短期的な対話記憶も非常に重要だ。
内蔵ヒューマン・コンピュータ・インタラクションのサポート. LangGraphネイティブサポートヒューマンコンピュータインタラクションパターン。ビルトインの永続化レイヤーはその重要な一部であるが、最近では "中断" これは、エンドユーザーとの新しいコミュニケーション方法である。
内蔵長期記憶. LangGraphには長期記憶が組み込まれている(基本的にはセマンティック検索をサポートした名前空間キー・バリュー・ストア)。これによりエージェントはヒューマンコンピュータインタラクションメモリー」を更新するのは簡単だ。
クーロンタスク.多くの環境保護剤新しいイベントをチェックするためにスケジュールで実行します。LangGraphプラットフォームにはこれをサポートするcronタスクが組み込まれています。
AIメール・アシスタントの構築
私たちの日常を構築することによって環境保護剤我々は、LangGraphを構築するのに非常に適したものにした。環境保護剤主なものの1つはEメールアシスタント。主なもののひとつはEメールアシスタントだ。もしあなたが過去6ヶ月の間に私に連絡を取ったのなら、AIエージェントがそのメールを起草した可能性が高い(そしてもし私があなたを見落としたのなら、それはAIエージェントのせいに違いない)。
このメールヘルパーは、無料で使用できるホスト型メールエージェントであり、オープンソースプロジェクトでもあります。私たちは、ホスト型メールエージェントが簡単に試せ、体験できることを望んでいます!環境保護剤オープンソース版は、この新しい設計パラダイムのリファレンス実装として機能する。