Marco de negociación ToM Palabras clave
Comandos de utilidad de AIActualizado hace 7 meses Círculo de intercambio de inteligencia artificial 2.4K 00
Original: https://arxiv.org/pdf/2402.13550.pdf
No hay nada nuevo bajo el sol. La idea central de este método es estimular al gran modelo para que piense, juzgue la intención basándose en el contexto y añada puntuación para que el gran modelo autocalibre la precisión, a fin de tomar la decisión final.
Lecturas recomendadas:Presentación de Intents --- Presentación de Intents (getzep.com)
Teoría ToM

La metodología se divide en dos secciones principales:
A (arriba) describe el proceso de creación de avisos específicos de tareas (Avisos) a partir del conjunto de datos de negociación y el uso de estos avisos para evaluar varios LLM. Al crear las instrucciones se incluye una descripción de la tarea, el número de elementos, el valor, las transcripciones de los diálogos y las preguntas.
B (abajo), en cambio, muestra la clasificación de las tareas en función de la objetividad, la fase de avance de la negociación (inicio, en curso, final) y el tipo de tarea (comprensión, modelización del interlocutor, anotación, generación). La información disponible varía según la fase; por ejemplo, en la fase inicial sólo se dispone del contexto de la negociación, mientras que en la fase final se dispone del diálogo completo. Los tipos de tareas incluyen la comprensión, el modelado del interlocutor (por ejemplo, deducir las prioridades del interlocutor), la anotación (por ejemplo, etiquetar los actos del diálogo) y la generación de respuestas.
Para ello, los investigadores diseñaron varias tareas que ponían a prueba el rendimiento de los LLM en diferentes competencias ToM a lo largo del proceso de negociación (en el caso de un ascenso y un aumento salarial), entre ellas.
1. Comprensión del entorno inicial de negociación (Comprensión)
Esta competencia requiere que los LLM accedan con precisión al estado inicial de ellos mismos y de sus oponentes en una negociación, como los recursos disponibles, las prioridades, etc., a partir de la información de fondo proporcionada. En el caso de las negociaciones sobre aumentos salariales, significa comprender el nivel salarial deseado y otras pretensiones del solicitante de empleo.
2. Anotación del Acto de Diálogo
Las partes negociadoras utilizarán diversas tácticas durante el diálogo, como proponer nuevas opciones, expresar puntos de vista opuestos, etc. LLM debe ser capaz de identificar estos comportamientos conversacionales para determinar el siguiente paso en la respuesta.
3. Especular sobre las intenciones del adversario (Partner Modeling)
En esencia, la TdM consiste en adivinar el estado interno y las necesidades del adversario. En una negociación de aumento salarial, esto podría incluir especular sobre el presupuesto salarial del reclutador basándose en el contenido del diálogo.
4. Generación de respuestas estratégicas
En última instancia, los LLM deben sintetizar los conocimientos y razonamientos precedentes para generar respuestas estratégicas que busquen maximizar los beneficios para el demandante de empleo y, al mismo tiempo, mantener una buena relación con el empleador.
Al comparar el rendimiento de múltiples LLM en los aspectos mencionados, el marco de investigación evalúa exhaustivamente sus capacidades y deficiencias en escenarios reales de negociación, y proporciona una base teórica y una hoja de ruta técnica para el desarrollo de sistemas prácticos de asistentes de negociación con IA.
Ejemplo de TdM
1. Tarea de comprensión.
DESCRIPCIÓN DE LA MISIÓN: Estás negociando con un compañero una serie de libros, sombreros y pelotas para determinar quién se queda con qué objetos. Los distintos tipos de objetos valen un número diferente de puntos para cada uno. Se te dará información sobre la negociación. A continuación, deberá responder a una pregunta.
Ejemplo de pregunta: Enumere el número de cada elemento e indique cuántos puntos vale cada elemento para cada uno de ustedes.
Ejemplo de contexto de diálogo: no se proporcionan palabras específicas, pero puede entenderse que es necesario proporcionar información contextual sobre la negociación, como el número y el valor en puntos de los elementos.
Ejemplo de respuesta de solicitud: Responda a la cantidad de cada artículo en formato JSON e indique el valor de cada artículo.
Ejemplo de consulta (tarea: sta_ask_point_values_ca).
Descripción de la tarea: Está negociando con su vecino de acampada un suministro extra de comida, agua y leña para su viaje de acampada.
Los diferentes tipos de paquetes valen diferentes cantidades de puntos para cada uno. Se te proporcionará información sobre la negociación. Se te proporcionará información sobre la negociación.
Luego, responderás a una pregunta.
Aquí se muestra el número de paquetes de comida, agua y leña disponibles en la negociación, contenidos en etiquetas .
Paquetes de comida: 3 Paquetes de agua: 3 Paquetes de leña: 3
Aquí tienes el número de puntos que obtienes por cada tipo de paquete, contenidos en etiquetas .
Cada paquete de comida: 3 puntos Cada paquete de agua: 5 puntos Cada paquete de leña: 4 puntos .
Pregunta: ¿Cuántos puntos vale para ti un paquete de cada tema? Presenta tu respuesta como un json dentro de tags con
claves como temas (alimentos, agua y leña) y valores como las respuestas correspondientes.
DESCRIPCIÓN DE LA MISIÓN: Estás negociando con tus vecinos de camping un suministro extra de comida, agua y leña para tu acampada.
Los distintos tipos de paquetes tienen un valor diferente para ambos. Recibirás información sobre esta negociación.
A continuación, responderá a una pregunta.
A continuación se muestra el número de paquetes de comida, agua y leña disponibles en la negociación, contenidos en la etiqueta .
Paquetes de comida: 3 Paquetes de agua: 3 Paquetes de leña: 3
Estas son las puntuaciones que se obtienen para cada tipo de paquete, contenidas en etiquetas .
Cada parcela de comida: 3 puntos Cada parcela de agua: 5 puntos Cada parcela de leña: 4 puntos .
Pregunta: para ti, ¿cuántos puntos es un paquete de cada pregunta? Presenta tu respuesta en json en la etiqueta , donde la clave es la pregunta (comida, agua, leña) y el valor correspondiente a la respuesta.
2. Tarea de anotación de actos de diálogo.
DESCRIPCIÓN DE LA TAREA: Analizar los comportamientos conversacionales en una negociación para identificar ofertas, objeciones u otros comportamientos estratégicos.
Pregunta de ejemplo: En un diálogo dado, identifique y etiquete el tipo de comportamiento de cada afirmación.
Ejemplo de contexto de diálogo: Se proporciona un discurso de negociación específico, por ejemplo, "Tú: si quieres el libro, yo me quedo con el sombrero y la pelota".
Ejemplo de respuesta a una solicitud: anotar cada acción del diálogo utilizando un conjunto predefinido de etiquetas.
Ejemplo de solicitud (tarea: dur_full_proposal_dnd):.
Descripción de la tarea: Está negociando con un compañero sobre cierta cantidad de libros, sombreros y pelotas para determinar quién se queda con qué objetos.
Los distintos tipos de objetos valen una cantidad diferente de puntos para cada uno. Se te proporcionará información sobre la negociación.
Luego, responderás a una pregunta.
Aquí están el número de libros, sombreros y pelotas disponibles en la negociación, contenidos en tags.
Libros: 3 Sombreros: 1 Pelotas: 2
Aquí tienes el número de puntos que obtienes por cada tipo de elemento, contenidos en etiquetas .
Cada libro: 1 puntos Cada sombrero: 5 puntos Cada pelota: 1 punto .
He aquí un enunciado de la negociación, contenido en tags.
YOU: me llevaré el sombrero y las pelotas si tú quieres los libros .
Pregunta: ¿Cuántos elementos obtiene el ponente por cada tema de la propuesta delimitado por las etiquetas ? Presente su respuesta en forma de json
dentro de etiquetas con claves como temas (libros, sombreros y pelotas) y valores como las respuestas correspondientes. Si la respuesta no está clara
para un número, salida NA.
Descripción de la tarea: Estás negociando con un compañero sobre el número de algunos libros, sombreros y pelotas para decidir quién se queda con qué objetos.
Cada punto tiene un valor diferente para cada uno de ustedes. Se le proporcionará información sobre las negociaciones.
A continuación, responderá a una pregunta.
Es el número de libros, sombreros y pelotas disponibles en la negociación, contenidos en la etiqueta .
Libros: 3 Sombreros: 1 Pelotas: 2
Es la cantidad de puntos que puedes obtener por cada elemento, contenida en la etiqueta .
Por libro: 1 punto Por sombrero: 5 puntos Por balón: 1 punto .
Se trata de una cita de la negociación, contenida en la etiqueta .
Tú: si quieres libros, me llevo el sombrero y la pelota </utterance
Pregunta: ¿cuántos objetos obtiene el orador por pregunta en la oferta delimitada por la etiqueta ? Dé su respuesta en formato json en la etiqueta , donde las claves son las preguntas (libros, sombreros y pelotas) y los valores son las respuestas correspondientes. Si la respuesta a una pregunta no está clara, escriba NA.
3. Tarea de modelado de socios.
Descripción de la tarea: Basándote en el diálogo de la negociación, especula qué elementos valora más la otra parte.
Pregunta de ejemplo: A partir del diálogo, infiera el orden de preferencia de los objetos por parte de la otra persona.
Ejemplo de contexto de diálogo: se presenta un escenario en el que el interlocutor propone una transacción y los interlocutores indican sus prioridades para el artículo.
Ejemplo de respuesta a una solicitud: respuesta en formato JSON, con el orden de preferencia de la otra parte.
Ejemplo de consulta (tarea: end_deal_specifics_ca).
Descripción de la tarea: Está negociando con su vecino de camping el suministro extra de comida, agua y leña para su acampada. Dispone de diferentes tipos de paquetes. de paquetes
Se te proporcionará información sobre la negociación. A continuación, responderás a una pregunta. Recibirás información sobre la negociación.
Aquí se muestra el número de paquetes de comida, agua y leña disponibles en la negociación, contenidos en etiquetas .
Paquetes de comida: 3 Paquetes de agua: 3 Paquetes de leña: 3
Aquí tienes el número de puntos que obtienes por cada tipo de paquete, contenidos en etiquetas .
Cada paquete de comida: 3 puntos Cada paquete de agua: 5 puntos Cada paquete de leña: 4 puntos .
Aquí está el diálogo completo, contenido en tags.
THEM: Hola, me gustaría tener tres paquetes de comida. Hemos decidido quedarnos una noche más pero necesitamos más comida para ello.
TÚ: Estaría abierto a eso si pudieras darme tres paquetes de agua.
Estoy bastante embarrado debido a la torpeza, así que puede que necesite uno extra. Estoy bastante embarrado debido a la torpeza, así que puede que necesite uno extra. Podría darte dos aguas y toda la leña. ¿Qué te parece?
TÚ: Entonces, ¿estás sugiriendo que me den 2 aguas, 3 leñas y nada de comida?
Bueno, más allá de la comida que ya tienes.
TÚ: Tengo una persona extra acampando con nosotros que no esperaba cuando compré la comida, así que me vendría bien una si estás dispuesto , y no estoy seguro de si estás dispuesto.
No esperaba quedarme una noche más, pero el tiempo es demasiado perfecto para irme. Puedo arreglármelas con dos paquetes de comida, seguro. Seguro que puedo arreglármelas con dos paquetes de comida.
¡Genial! ¡Gracias por ser tan comprensivo!
Entonces, ¿estamos de acuerdo en que yo obtengo 2 alimentos, 1 agua y tú obtienes lo contrario? También podría utilizar una leña, pero no es tan importante para mí. Yo también podría usar una leña, pero no es tan importante para mí.
TÚ: Puedo darte una leña, así que ¿me darás 1 comida, 2 agua y 2 leñas?
Pregunta: En el trato final, ¿cuántos artículos de cada tema conseguiste? Presenta tu respuesta como un json dentro de tags con claves como temas (comida, agua, etc.) agua, agua, agua, agua, agua, agua, agua, agua, agua, agua, agua.
Si no hubo acuerdo, responda NA para cada cuestión.
Misión: Estás negociando con tus vecinos de acampada las provisiones extra de comida, agua y leña para la acampada. Los distintos tipos de paquetes tienen valores diferentes para cada uno de vosotros. Te darán información sobre la negociación y luego tendrás que responder a una pregunta.
A continuación se muestra el número de paquetes de comida, agua y leña disponibles en la negociación, contenidos en la etiqueta .
Parcelas de comida: 3 Parcelas de agua: 3 Parcelas de leña: 3
A continuación se indica el número de puntos que se obtiene por cada parcela, contenido en la etiqueta .
Cada parcela de comida: 3 puntos Cada parcela de agua: 5 puntos Cada parcela de leña: 4 puntos .
Este es el diálogo completo, contenido en la etiqueta .
Ellos: Hola, me gustaría un paquete de tres comidas. Decidimos quedarnos una noche más pero necesitamos más comida.
USTED: Voy a tomar un paquete de tres de agua, si usted me da eso.
Ellos: Bueno... Como soy torpe puede que necesite un poco más. Puedo darte dos aguas y toda la leña, ¿qué te parece?
TÚ: ¿Así que me estás sugiriendo que compre 2 de agua, 3 de leña y nada de comida?
Ellos: ¡Correcto! Más comida de la que ya tienes.
TÚ: Tengo una persona extra acampando con nosotros y no lo espero cuando compro comida, así que usaré uno de esos si quieres
Ellos: ¡Te entiendo! No me apetecía quedarme una noche más, pero el tiempo era demasiado perfecto para irme fácilmente. Me habrían venido bien dos paquetes de comida, seguro.
Tú: ¡genial! Gracias por ser tan comprensivo.
Ellos: ¡No hay problema! Entonces, ¿estamos de acuerdo en que yo cojo 2 de comida y 1 de agua y tú haces lo contrario? A mí también me vendría bien una leña, pero no es muy importante para mí.
Tú: ¿puedo darte una leña para que me den 1 de comida, 2 de agua y 2 de leña? </diálogo
Pregunta: en la transacción final, ¿cuántos artículos de cada pregunta has conseguido? Proporcione sus respuestas en formato json en etiquetas , con las preguntas (comida, agua y leña) como claves y las respuestas correspondientes como valores. Si no hay protocolo, responda NA para cada pregunta.
4. Tarea de generación de respuestas estratégicas.
DESCRIPCIÓN DE LA TAREA: Al final de una negociación, generar una respuesta estratégica o proponer un acuerdo basándose en toda la historia del diálogo y en las preferencias de la otra parte.
Ejemplo de pregunta: al final de una negociación, genere una respuesta que considere cómo maximizar su puntuación, teniendo en cuenta las preferencias de su interlocutor.
Ejemplo de contexto de diálogo: proporciona todo el diálogo de negociación, incluidas las propuestas y preferencias de ambas partes.
Ejemplo de respuesta a la solicitud: genera una respuesta con formato JSON que contiene una oferta estratégica, o una aceptación o rechazo de la oferta actual.
Ejemplo de consulta (tarea: end_deal_total_ca).
Descripción de la tarea: Está negociando con su vecino de camping el suministro extra de comida, agua y leña para su acampada. Dispone de diferentes tipos de paquetes. de paquetes
Se te proporcionará información sobre la negociación. A continuación, responderás a una pregunta. Recibirás información sobre la negociación.
Aquí se muestra el número de paquetes de comida, agua y leña disponibles en la negociación, contenidos en etiquetas .
<count>
Paquetes de comida: 3
Paquetes de agua: 3
Paquetes de leña: 3
</count>
Aquí tienes el número de puntos que obtienes por cada tipo de paquete, contenidos en etiquetas .
<value>
Cada paquete de alimentos: 3 puntos
Cada paquete de agua: 5 puntos
Cada paquete de leña: 4 puntos
</value>
Aquí está el diálogo completo, contenido en etiquetas .
<dialogue>
ELLOS: Hola, me gustaría tener tres paquetes de comida. Hemos decidido quedarnos una noche más pero necesitamos más comida para ello.
Estaría abierto a eso si pudieras darme tres paquetes de agua
Estoy bastante embarrado debido a la torpeza, así que puedo necesitar uno extra. Estoy bastante embarrado debido a la torpeza, así que puede que necesite uno extra. Podría darte dos aguas y toda la leña.
TÚ: Entonces, ¿estás sugiriendo que me den 2 aguas, 3 leñas y nada de comida?
Bueno, más allá de la comida que ya tienes.
TÚ: Tengo una persona extra acampando con nosotros que no esperaba cuando compré la comida, así que me vendría bien una si estás dispuesto.
No esperaba quedarme una noche más, pero el tiempo es demasiado perfecto para irme. Puedo arreglármelas con dos paquetes de comida, seguro.
¡Genial! ¡Gracias por ser tan comprensivo!
Entonces, ¿estamos de acuerdo en que yo obtengo 2 alimentos, 1 agua y tú obtienes lo contrario? También podría utilizar una leña, pero no es tan importante para mí. Yo también podría usar una leña, pero no es tan importante para mí.
Puedo darte una leña, ¿así que recibiré 1 comida, 2 agua y 2 leñas?
</dialogue>
Pregunta: ¿Cuántos puntos has conseguido al final de la negociación?
NOTA: ¡Pensemos paso a paso! Pon tus pensamientos en etiquetas , y pon tu respuesta como un solo número en etiquetas . .
DESCRIPCIÓN DE LA MISIÓN: Estás negociando con los vecinos de tu campamento un excedente de comida, agua y leña. Los distintos tipos de paquetes tienen diferentes puntos de valor. Se te dará información sobre la negociación. A continuación, responderá a una pregunta.
Es el número de paquetes de comida, agua y leña disponibles en la negociación, contenidos en la etiqueta .
<count>
Paquetes de alimentos: 3
Parcelas de agua: 3
Parcelas de leña: 3
</count>
Es la puntuación que se obtiene para cada tipo de paquete, contenida en la etiqueta .
<value>
Por paquete de alimentos: 3 puntos
Por parcela de agua: 5 puntos
Cada parcela de leña: 4 puntos
</value>
Este es el diálogo completo, contenido en la etiqueta .
<dialogue>
Ellos: Hola, quiero tres paquetes de comida. Hemos decidido quedarnos una noche más, pero necesitamos más comida.
TÚ: Si puedes conseguirme tres paquetes de agua, me los llevo.
Ellos: hmmm ...... Me ensucié mucho debido a mi torpeza, así que puede que necesite uno extra. Puedo darte dos para el agua y toda la leña. ¿Qué te parece?
TÚ: ¿Me estás sugiriendo que compre 2 de agua, 3 de leña y nada de comida?
Ellos: ¡Correcto! Vale, excepto por la comida que ya tienes.
TÚ: Tengo una persona extra acampando con nosotros que no había previsto cuando compré la comida, podría usar una si quieres.
Lo comprendo. No pensaba quedarme una noche más, pero el tiempo era demasiado bueno para irme. Estoy segura de que podré arreglármelas con dos paquetes de comida.
Tú: ¡Genial! Gracias por ser tan comprensivo.
Ellos: ¡No hay problema! ¿Estamos de acuerdo en que yo me llevo 2 de comida, 1 de agua y tú lo contrario? Puede que también necesite leña, pero es menos importante para mí.
Tú: ¿Puedo darte una leña para que me den 1 de comida, 2 de agua y 2 de leña?
</dialogue>
Pregunta: Al final de las negociaciones, ¿cuántos puntos recibió?
Nota: ¡Pensemos paso a paso! Pon tu proceso de pensamiento en la etiqueta y tu respuesta como un solo número en la etiqueta .
Lógica de ejecución ToM
1. La tarea de comprender desde el principio:
Descripción de la misión: estás llegando a un acuerdo con otros campistas del barrio causante para conseguir más comida, agua y leña. Los distintos tipos de parcelas tienen valores diferentes para cada uno de vosotros. Recibirás información detallada sobre las negociaciones y luego tendrás que responder a una pregunta.
A continuación se muestra el número de parcelas de comida, agua y leña disponibles en la negociación, anotadas en la etiqueta . Parcelas de comida: 3 Parcelas de agua: 3 Parcelas de leña: 3
Estos son los puntos que puedes ganar en función de cada tipo de parcela, anotados en la etiqueta . Cada parcela de comida: 3 puntos Cada parcela de agua: 5 puntos Cada parcela de leña: 4 puntos.
PREGUNTA: ¿Cuántos puntos vale para usted un paquete por pregunta? Por favor, responda en formato json que contenga etiquetas , donde la clave representa la pregunta (comida, agua, leña) y el valor es la respuesta correspondiente.
2. Tareas de anotación en curso:
DESCRIPCIÓN DE LA MISIÓN: Estás negociando con tu compañero para conseguir más libros, sombreros y pelotas. Los diferentes tipos de artículos tienen diferentes valores para ti. Recibirás información detallada sobre las negociaciones, tras lo cual tendrás que responder a una pregunta.
Este es el número de libros, sombreros y pelotas que puedes conseguir en la negociación, anotado en la etiqueta . Libros: 3 Sombreros: 1 Pelotas: 2.
Estos son los puntos que puedes ganar en función de cada tipo de objeto, anotados en la etiqueta . Cada libro: 1 punto Cada sombrero: 5 puntos Cada pelota: 1 punto.
La siguiente es una cita del proceso de negociación, anotada en la etiqueta . Tú: Si quieres el libro, yo traeré el sombrero y la pelota.
Pregunta: ¿cuántos elementos obtiene el orador en cada una de las sugerencias divididas por la etiqueta ? Respuesta en formato json que contiene etiquetas , donde la clave representa la pregunta (libro, sombrero, pelota) y el valor es la respuesta correspondiente. Si la respuesta a una pregunta no está clara, escriba NA.
3. Comprensión de las tareas al final de la fase:
Descripción de la misión: Estás llegando a un acuerdo con un campista vecino sobre un suministro adicional de comida, agua y leña. Los distintos tipos de paquetes tienen distintos valores para ti, y se te dará información detallada sobre las negociaciones y tendrás que responder a una pregunta.
Este es el número de paquetes de comida, agua y leña a los que tienes acceso durante las negociaciones, registrados en la etiqueta . Parcelas de comida: 3 Parcelas de agua: 3 Parcelas de leña: 3
Este es el número de puntos que puedes ganar en función de cada tipo de parcela, anotado en la etiqueta . Cada parcela de comida: 3 puntos Cada parcela de agua: 5 puntos Cada parcela de leña: 4 puntos.
Aquí está el diálogo completo, anotado en la etiqueta . ...
PREGUNTA: En la transacción final, ¿cuánto recibiste de cada artículo? Por favor, responda en formato json que contenga etiquetas , donde la clave representa la pregunta (comida, agua, leña) y el valor es la respuesta correspondiente. Si no hay acuerdo, para todas las preguntas rellene NA para la respuesta.
4. Indicaciones para pensar en cadena:
DESCRIPCIÓN DE LA MISIÓN: Estás negociando con los campistas vecinos el suministro de comida, agua y leña. Los distintos tipos de paquetes tendrán valores diferentes para cada uno de vosotros y se os dará información detallada sobre la negociación y tendréis que responder a una pregunta.
Este es el número de paquetes de comida, agua y leña a los que tienes acceso durante las negociaciones, registrados en la etiqueta . Parcelas de comida: 3 Parcelas de agua: 3 Parcelas de leña: 3
Este es el número de puntos que puedes ganar en función de cada tipo de parcela, anotado en la etiqueta . Cada parcela de comida: 3 puntos Cada parcela de agua: 5 puntos Cada parcela de leña: 4 puntos.
Aquí está el diálogo completo, anotado en la etiqueta . ...
PREGUNTA: Al final de la negociación, ¿cuántos puntos había ganado en total?
Nota: ¡Piensa paso a paso! Registra tu proceso de pensamiento en la etiqueta y tu respuesta con un número en la etiqueta .
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...