オリジナル:https://arxiv.org/pdf/2402.13550.pdf
この手法の核となる考え方は、ビッグモデルの思考を刺激し、文脈から意図を判断し、ビッグモデルが自己調整するようにスコアリングを加え、最終的な判断を下すことである。
ToM理論
方法論は大きく2つのセクションに分かれている:
A(上)は、ネゴシエーションデータセットからタスク固有のプロンプト(Prompts)を作成し、これらのプロンプトを使用して様々なLLMを評価するプロセスを説明する。プロンプトを作成する際には、タスクの説明、アイテムの数、値、対話の記録、および質問が含まれる。
一方、B(下)は、客観性、交渉の進行段階(開始、進行中、終了)、タスクのタイプ(理解、パートナーモデリング、注釈、生成)に応じてタスクを分類したものである。例えば、開始段階では交渉の文脈のみが利用可能であったが、終了段階では完全な対話が利用可能であった。タスクの種類には、理解、パートナー・モデリング(パートナーの優先順位の推測など)、注釈(対話行為のラベル付けなど)、応答生成が含まれる。
この目的のため、研究者らは、交渉プロセス(昇進・昇給の場合)を通して、LLMのさまざまなToMコンピテンシーに関するパフォーマンスをテストする、以下のようないくつかのタスクを設計した。
1.最初の交渉環境の理解(Comprehension)
このコンピテンシーでは、LLMは提供された背景情報から、利用可能なリソースや優先順位など、交渉における自身と相手の初期状態に正確にアクセスする必要がある。昇給交渉の場合は、求職者の希望給与水準やその他の主張を理解することを意味する。
2.ダイアログ・アクト・アノテーション
交渉当事者は対話の中で、新しい選択肢を提案したり、反対意見を述べたりなど、さまざまな戦術を用いる。LLMは、次の対応ステップを決定するために、これらの会話行動を識別できる必要がある。
3.敵の意図を推測する(パートナー・モデリング)
ToMの核心は、相手の内面状態やニーズを推測することである。昇給交渉であれば、対話の内容から採用担当者の給与予算を推測することも含まれるかもしれない。
4.戦略的レスポンスの生成
最終的には、LLMは、雇用主との良好な関係を維持しながら、求職者の利益を最大化しようとする戦略的な対応を生み出すために、先の理解と推論を総合する必要がある。
上記の側面から複数のLLMの性能を比較することにより、本研究の枠組みは、実際の交渉シナリオにおけるLLMの能力と欠点を総合的に評価し、実用的なAI交渉支援システムの開発のための理論的基礎と技術的ロードマップを提供する。
ToMの例
1.理解課題。
ミッションの説明:あなたは本や帽子、ボールなどをめぐってパートナーと交渉し、誰がどのアイテムを手に入れるかを決める。アイテムの種類によって、それぞれ異なるポイント数が与えられます。交渉に関する情報が与えられる。その後、質問に答える必要があります。
質問例:各項目の番号を挙げ、各項目があなた方にとって何点に相当するかを述べてください。
対話の文脈の例:具体的な単語は提供されていないが、交渉に関する文脈情報を提供する必要があることは理解できる。
リクエスト回答例:各項目の数量をJSON形式で回答し、各項目の値を記載してください。
サンプルプロンプト(タスク:sta_ask_point_values_ca)。
タスクの詳細:あなたはキャンプ場の隣人と、キャンプに必要な食料、水、薪の追加調達について交渉している。
パッケージの種類によって、各自に与えられるポイントが異なります。 交渉に関する情報が提供されます。交渉に関する情報が提供されます。
そして、質問に答える。
以下は、タグに含まれる、ネゴシエーションで利用可能な食料、水、薪のパッケージの数である。
食料:3 水:3 薪:3
以下は、タグに含まれる、パッケージの種類ごとに得られるポイント数である。
各食糧パッケージ:3点 各水パッケージ:5点 各薪パッケージ:4点</価値
質問:各問題の1パッケージは、あなたにとって何点の価値がありますか? あなたの答えを、タグ内のjsonとして提示しなさい。
キーを課題(食料、水、薪)とし、対応する答えを価値観とする。
ミッション内容:あなたはキャンプ場の隣人と、キャンプに必要な食料、水、薪の追加調達について交渉している。
パッケージの種類によって、お二人にとっての価値は異なります。この交渉についての情報が与えられます。
その後、質問に答える。
以下は、タグに含まれる、ネゴシエーションで利用可能な食料、水、薪のパッケージの数である。
食料:3パック 水:3パック 薪:3パック
以下は、タグに含まれる、パッケージの種類ごとに得られるスコアです。
食料小包1つ:3点 水小包1つ:5点 薪小包1つ:4点</値
質問:あなたにとって、各質問のパケットは何点ですか?あなたの答えをタグ内のjsonで提示し、キーは質問(食料、水、薪)と答えに対応する値です。
2.ダイアログ・アクト・アノテーション・タスク。
課題内容:交渉における会話行動を分析し、オファー、異議、その他の戦略的行動を特定する。
サンプル問題:与えられた対話文の中で、それぞれの文に対する行動のタイプを特定し、ラベル付けしなさい。
対話の文脈の例:具体的な交渉の談話が提示される(例:「君:本が欲しいなら、帽子とボールをもらうよ」)。
リクエスト応答例: ダイアログ内の各アクションに、あらかじめ定義されたタグのセットを使用して注釈を付ける。
サンプルプロンプト (task: dur_full_proposal_dnd):.
タスクの説明: あなたは、本、帽子、ボールの数量についてパートナーと交渉し、誰がどのアイテムを手に入れるかを決めている。
交渉に関する情報が提供される。
そして、質問に答える。
タグに含まれる、交渉で入手可能な本、帽子、ボールの数である。
本:3 帽子:1 ボール:2
以下は、タグに含まれる、アイテムの種類ごとに得られるポイント数である。
本:1点 帽子:5点 ボール:1点</値
以下は、タグに含まれる交渉の発言である。
YOU: 本が欲しければ、帽子とボールをもらうよ。
質問:タグで区切られたプロポーザルの各イシューについて、発言者はいくつのアイテムを得ることができますか? 答えをjsonで提示してください。
タグ内で、キーを問題(本、帽子、ボール)、値を対応する答えとする。 答えが明確でない場合
を出力する。
タスクの説明: 本、帽子、ボールの個数についてパートナーと交渉し、誰がどのアイテムを手に入れるかを決める。
各項目にはそれぞれ異なるポイントが設定されている。交渉に関する情報が提供されます。
それから質問に答える。
これは、タグに含まれる、交渉で利用可能な本、帽子、ボールの数である。
本:3 帽子:1 ボール:2
これは、タグに含まれる、各項目で獲得できるポイントの量である。
本1冊につき:1点 帽子1個につき:5点 ボール1個につき:1点</値
これはタグに含まれる交渉の引用である。
あなた:本が欲しいなら、帽子とボールをもらうよ</utterance
質問:タグで区切られたオファーで、発言者は1つの質問につき何個のアイテムを手に入れることができますか?タグにjson形式で答えを書いてください。キーは質問(本、帽子、ボール)、値は対応する答えです。質問の答えが明確でない場合は、NAを出力してください。
3.パートナー・モデリング・タスク
課題内容:交渉における対話をもとに、相手が最も重視している項目を推測する。
例題: 会話の内容から相手のアイテムの好みの順番を推測してください。
対話コンテクストの例:話し手が取引を提案し、パートナーがその品目に対する優先順位を示すシナリオが用意されている。
リクエスト・レスポンスの例:相手の優先順位を列挙したJSON形式の回答。
サンプルプロンプト(タスク:end_deal_specifics_ca)。
タスクの詳細: あなたはキャンプ場の隣人と、キャンプ旅行に必要な食料、水、薪の追加調達について交渉している。 さまざまな種類のパッケージが用意されている。パッケージの種類
交渉に関する情報が提供されます。 その後、質問に答えます。交渉に関する情報が提供されます。
以下は、タグに含まれる、ネゴシエーションで利用可能な食料、水、薪のパッケージの数である。
食料:3 水:3 薪:3
以下は、タグに含まれる、パッケージの種類ごとに得られるポイント数である。
各食糧パッケージ:3点 各水パッケージ:5点 各薪パッケージ:4点</価値
以下は、タグに含まれる完全なダイアログである。
テム:こんにちは、食料を3パックお願いします。 延泊することにしたのですが、そのために食料がもっと必要なんです。
あなた:水を3パックくれるなら、それは受け入れるわ。
僕は不器用だから泥だらけなんだ。私は不器用でかなり泥だらけなので、1つ余分に必要かもしれない。 私はあなたに2つの水とすべての薪を与えることができる。 どう思う?
あなた:つまり、水2本、薪3本、食料なしということですか?
まあ、あなたがすでに持っている食料を超える。
YOU:食材を買うときに予想外に1人余分にキャンプに来ているから、もしよければ1人使ってもいいよ。
延泊するとは思っていなかったが、天気が良すぎて帰る気になれない。 確かに食料が2パックあればなんとかなる。確かに食料が2パックあればなんとかなる。
あなた:いいね! 理解してくれてありがとう!
つまり、私は食料2、水1、あなたはその逆ということでよろしいでしょうか? 私は薪を1本使うこともできますが、私にとってはそれほど重要ではありません。私はまた、おそらく薪を1つ使うことができるが、それは私にとってそれほど重要ではない。
あなた:薪を1本あげるから、食料1本、水2本、薪2本でどう?
質問:最終的な取引で、あなたは各問題のいくつのアイテムを手に入れましたか? あなたの答えを、タグ内のjsonとして、issue(食料、水など)をキーにして提示してください。水、水、水、水、水、水、水、水、水、水、水、水、水。
同意が得られなかった場合は、各問題について「NA」と回答する。
ミッション・ステートメント:あなたは、キャンプ旅行のための食料、水、薪の追加調達について、キャンプ場の隣人と交渉している。荷物の種類によって、それぞれの価値観は異なります。交渉に関する情報が与えられ、質問に答えます。
以下は、タグに含まれる、ネゴシエーションで利用可能な食料、水、薪のパッケージの数である。
食料区画:3 水区画:3 薪区画:3
以下は、タグに含まれる、各区画の獲得ポイント数である。
各食糧小包:3pt 各水小包:5pt 各薪小包:4pt</値
これはタグに含まれる完全なダイアログである。
Them: こんにちは、3パック分の食料が欲しいのですが。延泊することにしたんですが、もっと食料が必要なんです。
あなた:3本入りの水をください。
彼ら:そうですね...。僕は不器用だから、もう少し必要かもしれない。水2本と薪全部あげるけど、どう思う?
あなた:つまり、水2本、薪3本、食料なしということですか?
彼ら:そう!今持っている以上の食べ物を。
YOU:一緒にキャンプしている人が1人余っているんだけど、食料を買うときにその人が来るとは思わないから、もしよかったら1人使わせてもらうよ。
彼ら:わかるよ!でも、天気が良すぎて簡単には帰れなかったんだ。確かに食料小包は2つ使えたんだけどね。
あなた:素晴らしい!理解してくれてありがとう!
彼ら:問題ない!じゃあ、僕は食料2つと水1つ、君はその逆ということでいいかな。僕は薪も使えるかもしれないけど、僕にとってはあまり重要じゃないんだ。
あなた:薪をあげるから、食料1、水2、薪2をもらえない?</dialogue
質問:最終的な取引では、各質問のアイテムをいくつ入手しましたか?回答をタグのjson形式で、質問(食料、水、薪)をキー、対応する回答を値として記入してください。プロトコルがない場合は、各質問に対してNAと答えてください。
4.戦略的レスポンス生成タスク
課題内容:交渉の終わりに、対話の全過程と相手の好みに基づいて、戦略的な返答を生み出すか、取引を提案する。
サンプル問題:交渉の最後に、相手の好みを考慮した上で、自分の得点を最大にする方法を考える回答を作成する。
対話コンテキストの例:双方の提案や好みを含む交渉対話全体を提供する。
リクエスト・レスポンスの例:戦略的オファー、または現在のオファーの受諾または拒否を含むJSON形式のレスポンスを生成する。
サンプルプロンプト(タスク:end_deal_total_ca)。
タスクの詳細: あなたはキャンプ場の隣人と、キャンプ旅行に必要な食料、水、薪の追加調達について交渉している。 さまざまな種類のパッケージが用意されている。パッケージの種類
交渉に関する情報が提供されます。 その後、質問に答えます。交渉に関する情報が提供されます。
以下は、タグに含まれる、ネゴシエーションで利用可能な食料、水、薪のパッケージの数である。
<カウント
フードパッケージ: 3
ウォーターパッケージ: 3
薪パッケージ: 3
。
以下は、タグに含まれる、パッケージの種類ごとに得られるポイント数である。
<値
各食品パッケージ:3点
各水パッケージ:5点
薪パッケージ:4点
以下は、タグで囲まれた完全なダイアログである。
<ダイアログ
THEM: こんにちは、食料を3パックお願いします。 延泊することにしたんですが、そのために食料がもっと必要なんです。
水を3パックくれるのなら、私はそれを受け入れるよ。
私は不器用でかなり泥だらけだから、1つ余分に必要かもしれない。私は不器用でかなり泥だらけなので、1つ余分に必要かもしれない。 私はあなたに2つの水とすべての薪を与えることができる。
あなた:つまり、水2本、薪3本、食料なしということですか?
まあ、あなたがすでに持っている食料を超える。
YOU:食材を買うときに予想外に1人余分にキャンプに行くことになったので、もしよければ1人使ってもいいんだけど。
延泊するとは思っていなかったが、天気が良すぎて帰る気になれない。食料は2パックあればなんとかなる。
あなた:いいね! 理解してくれてありがとう!
つまり、私は食料2、水1、あなたはその逆ということでよろしいでしょうか? 私は薪を1本使うこともできますが、私にとってはそれほど重要ではありません。私はまた、おそらく薪を1つ使うことができるが、それは私にとってそれほど重要ではない。
薪を1本あげるから、食料1本、水2本、薪2本でどうだ?
質問:交渉の結果、何点を獲得しましたか?
注:ステップ・バイ・ステップで考えましょう!あなたの考えを タグに入れ、あなたの答えを answer>タグに1つの数字として入れます。answer>タグの中に、答えを数字で書きましょう。
ミッション内容:あなたはキャンプ場の隣人と、余剰の食料、水、薪を交渉している。荷物の種類によって価値が異なる。交渉に関する情報が与えられる。その後、質問に答える。
これは、タグに含まれる、交渉で利用可能な食料、水、薪の小包の数である。
<カウント
食料小包:3個
水区画: 3
薪区画:3
。
これは、タグに含まれる、パッケージの種類ごとに得られるスコアである。
<値
食品小包1個につき:3ポイント
水区画あたり:5ポイント
各薪区画:4ポイント
これはタグに含まれる完全なダイアログである。
<ダイアログ
Them: こんにちは、食料小包を3つお願いします。もう一泊することにしたんだけど、食料が足りないんだ。
あなた:水の小包を3つもらえるなら、もらうよ。
彼ら:うーん......。不器用でとても汚れてしまったから、もう1つ余分に必要かもしれない。水と薪全部で2つあげるよ。どう思う?
あなた:つまり、水2、薪3、食料なしということですか?
彼ら:そうだね! オーケー、すでに持っている食べ物以外はね。
YOU:食材を買うときに予想してなかったんだけど、一緒にキャンプする人が1人増えたんだ。
わかるよ!でも、天気が良すぎて帰る気になれなかったんだ。食料小包が2つあっても大丈夫だと思う。
あなた:素晴らしい! 理解してくれてありがとう!
彼ら:問題ない!僕は食料2、水1、君はその逆ということでいいかな?薪も必要かもしれないけど、僕にとってはあまり重要じゃないんだ。
あなた:薪を1本あげるから、食料1、水2、薪2をもらえない?
質問:交渉終了時、あなたは何点を獲得しましたか?
注:ステップ・バイ・ステップで考えよう!思考過程を タグに、答えを1つの数字として タグに記述します。
ToM実行ロジック
1.最初に理解すること:
ミッションの内容:あなたは原因近隣の他のキャンパーと、食料、水、薪を追加する契約を結んでいる。区画の種類によって、それぞれの価値が異なります。あなたは交渉に関する詳細な情報を受け取り、質問に答える必要があります。
以下は、タグに記された、交渉で利用可能な食料、水、薪の小包の数である。食料: 3 水: 3 薪: 3
タグに記載されている小包の種類によって獲得できるポイントは以下の通りです。各食糧小包:3ポイント 各水小包:5ポイント 各薪小包:4ポイント</value
質問:1問1小包はあなたにとって何ポイントに相当しますか? タグを含むjson形式でお答えください。キーは質問(食料、水、薪)を表し、値は対応する答えを表します。
2.継続的な注釈作業
ミッションの説明:あなたは本、帽子、ボールをより多くもらうためにパートナーと交渉している。アイテムの種類によって、あなたにとっての価値は異なります。交渉に関する詳細な情報が与えられ、その後質問に答える必要があります。
以下は、タグに記された、交渉で得られる本、帽子、ボールの数である。本:3 帽子:1 ボール:2.
以下は、タグに記述された各アイテムの種類に応じて獲得できるポイントです。本:1点 帽子:5点 ボール:1点</値
以下は、タグに記された交渉過程の引用である。あなた:本が欲しいなら、帽子とボールを取ってきますよ。
質問: タグで分割された各提案で、発言者はいくつの項目を得ますか? 答えはタグを含むjson形式で、キーは質問(本、帽子、ボール)を表し、値は対応する答えです。質問の答えが明確でない場合は、NAと記入してください。
3.フェーズ終了時のタスクの理解:
ミッションの内容:あなたは食料、水、薪の追加供給について近隣のキャンパーと合意しようとしている。小包の種類によって価値が異なるので、交渉に関する詳しい情報が与えられ、質問に答える必要があります。
タグに記録されている、交渉中に入手できる食料、水、薪の小包の数です。食料の小包: 3 水の小包: 3 薪の小包: 3
これは、タグに記載されている小包の種類に応じて獲得できるポイント数です。各食糧小包:3ポイント 各水小包:5ポイント 各薪小包:4ポイント</値
以下は、タグに記述されたダイアログの全文である。...
質問:最終的な取引で、各アイテムをどれくらい手に入れましたか? タグを含むjson形式でお答えください。キーは質問(食料、水、薪)を表し、値は対応する答えを表します。一致しない場合は、すべての質問について、答えをNAと記入してください。
4.チェーン・シンキング・プロンプト
ミッション内容:あなたは近隣のキャンパーと食料、水、薪の供給について交渉している。小包の種類によって価値が異なり、交渉に関する詳細な情報が与えられ、質問に答える必要がある。
タグに記録されている、交渉中に入手できる食料、水、薪の小包の数です。 食料の小包: 3 水の小包: 3 薪の小包: 3
これは、タグに記載されている小包の種類に応じて獲得できるポイント数です。各食糧小包:3ポイント 各水小包:5ポイント 各薪小包:4ポイント</値
以下は、タグに記述されたダイアログの全文である。...
質問者:交渉が終わるまでに、合計で何点獲得しましたか?
注:一歩ずつ考えていきましょう! タグの中にあなたの思考プロセスを、タグの中にあなたの答えを数字で記録してください。