RAG emocional: inteligencia para mejorar el juego de rol mediante la recuperación emocional

Base de conocimientos de IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

52.5K 00

resúmenes

El campo de la investigación de los agentes de rol para generar respuestas similares a las humanas ha atraído cada vez más atención a medida que los modelos de lenguaje de gran tamaño (LLM) han demostrado un alto grado de capacidades similares a las humanas. Esto ha facilitado la exploración de agentes de juegos de rol en una variedad de aplicaciones, como chatbots que pueden entablar conversaciones naturales con los usuarios, y asistentes virtuales que pueden proporcionar apoyo y orientación personalizados. Un elemento clave de las tareas de role-playing es el uso eficaz de la memoria del personaje, que almacena su perfil, experiencias y diálogo histórico. Para mejorar la generación de respuestas de los agentes de juegos de rol, se utilizan técnicas de generación aumentada por recuperación (RAG) para acceder a las memorias relevantes. La mayoría de los estudios actuales recuperan la información relevante basándose en la similitud semántica de los recuerdos para mantener las características personalizadas del personaje, mientras que se han hecho pocos intentos de utilizar la LLM en la RAG Proponemos una novedosa teoría de la memoria consciente de las emociones inspirada en la teoría de la "memoria dependiente de las emociones" (que afirma que las personas recuerdan mejor los acontecimientos si reactivan sus emociones originales durante el aprendizaje). Inspirándonos en la teoría de la "memoria dependiente de la emoción" (que afirma que las personas recuerdan mejor los acontecimientos si reactivan la emoción original de aprendizaje durante el recuerdo), proponemos un novedoso marco para la recuperación de recuerdos conscientes de las emociones denominado RAG emocional (Emotional RAG). " (RAG Emocional), que tiene en cuenta los estados emocionales en los agentes de rol para recuperar recuerdos relevantes. En concreto, diseñamos dos estrategias de recuperación, a saber, la estrategia de combinación y la estrategia de secuencia, para combinar la semántica de los recuerdos y los estados afectivos en el proceso de recuperación. Extensos experimentos en tres conjuntos de datos representativos de juegos de rol muestran que nuestro marco RAG Emocional tiene un rendimiento superior en la preservación de la individualidad del personaje en comparación con los enfoques que no tienen en cuenta la emoción. Esto respalda la teoría psicológica de la memoria dependiente de la emoción. Nuestro código está a disposición del público en https://github.com/BAI-LAB/EmotionalRAG.

Conclusiones importantes:
Incorporar estados emocionales en la recuperación de la memoria mejora la coherencia de la personalidad
La teoría psicológica de la memoria dependiente de las emociones puede aplicarse a los agentes de IA
Diferentes estrategias de recuperación funcionan mejor para diferentes indicadores de evaluación de la personalidad
La coherencia emocional mejora la humanización de las respuestas generadas

RAG emocional, agentes de juegos de rol, modelización de grandes lenguajes

Fig. 1: Arquitectura general del marco del GAR Emocional. Consta de cuatro componentes: un componente de codificación de consultas, un componente de codificación de recuerdos, un componente de recuperación de emociones y un componente de generación de respuestas.

doctrinal

A medida que la inteligencia artificial sigue evolucionando en los Large Language Models (LLM), los LLM muestran un alto grado de capacidades similares a las humanas. El uso de LLM como agentes de juegos de rol, que imitan las respuestas humanas, ha demostrado una gran capacidad para generar respuestas que mantienen las características personalizadas de los personajes. Los agentes de juegos de rol se han utilizado en varios ámbitos, como los agentes de atención al cliente y los agentes de guías turísticos. Estos agentes han demostrado un gran potencial en aplicaciones comerciales y han atraído cada vez más la atención de la investigación en LLM.

El factor más importante para mantener las características y capacidades personalizadas de un rol es la memoria. Los agentes de juegos de rol acceden a datos históricos como perfiles de usuario, experiencias en eventos, conversaciones recientes, etc. realizando recuperaciones en sus unidades de memoria para proporcionar información rica y personalizada a los LLM en las tareas de juego de rol. Las técnicas de Generación Aumentada de Recuperación (RAG) se utilizan para acceder a recuerdos relevantes y aumentar la generación de respuestas del agente de juegos de rol, lo que se denomina RAG de memoria.

Se han utilizado varios mecanismos de memoria en distintas aplicaciones LLM. Por ejemplo, la curva de olvido de Ebbinghaus inspiró el desarrollo de MemoryBank, que facilita la realización de esquemas de memoria más parecidos a los humanos. Además, basándose en la teoría del proceso dual de Kahneman, el marco MLP introduce un innovador mecanismo de mejora de la memoria de proceso dual que integra eficazmente la memoria a largo y corto plazo.

Aunque la investigación ha demostrado la eficacia del uso de la memoria en las aplicaciones de modelado de grandes lenguajes (LLM) descritas anteriormente, conseguir respuestas más humanas de los agentes de juegos de rol sigue siendo un campo de investigación que aún no se ha explorado a fondo. Inspirándonos en la investigación cognitiva en psicología, hicimos el primer intento de simular los procesos cognitivos humanos durante el recuerdo. Nos basamos en la teoría de la memoria emocionalmente dependiente propuesta por el psicólogo Gordon H. Bower en 1981:Las personas recuerdan mejor los acontecimientos cuando de alguna manera recuperan y rememoran las emociones crudas que experimentaron durante el proceso de aprendizaje.. Al inducir experimentalmente emociones alegres o tristes en los sujetos para explorar los efectos de las emociones en la memoria y el pensamiento, observó que las emociones determinan no sólo la elección de la información recordada, sino también cómo se recuperan los recuerdos. Esto sugiere que los individuos son más propensos a recordar información que concuerda con su estado emocional actual.

Basándonos en la teoría psicológica de la memoria dependiente de las emociones, proponemos un nuevo marco de recuperación de la memoria consciente de las emociones, denominado RAG emocional, para mejorar el proceso de generación de respuestas de los agentes de juegos de rol. En Emotional RAG, la recuperación de recuerdos sigue el criterio de coherencia emocional, lo que significa que tanto la relevancia semántica de los recuerdos recordados como el estado emocional se tienen en cuenta en el proceso de recuperación. En concreto, diseñamos dos estrategias de recuperación flexibles, la estrategia de combinación y la estrategia de secuencia, para combinar los estados semántico y emocional de los recuerdos en el proceso de la GAR. Mediante el uso de la GAR emocional, el agente de juego de rol es capaz de mostrar cualidades más parecidas a las humanas, lo que aumenta la interactividad y el atractivo del modelo de lenguaje de gran tamaño. A continuación se resumen las aportaciones de este artículo:

Inspirándonos en la teoría de la memoria dependiente de la emoción, hacemos el primer intento de modelar los procesos cognitivos humanos introduciendo un efecto de coherencia emocional en el recuerdo de la memoria de un agente de juegos de rol. Demostramos de forma exhaustiva la eficacia de aplicar la teoría de la memoria emocional de Bower al desarrollo de la inteligencia artificial, lo que aporta más pruebas de apoyo a la teoría de la memoria dependiente de la emoción en psicología.
Proponemos un nuevo marco de recuperación de la memoria que tiene en cuenta las emociones, denominado RAG emocional, que recupera recuerdos relevantes basándose en la relevancia semántica y los estados emocionales en un agente de juego de rol. Además, proponemos estrategias de recuperación flexibles, es decir, estrategias combinatorias y secuenciales, para fusionar los estados semánticos y emocionales de los recuerdos durante la recuperación.
Llevamos a cabo experimentos exhaustivos en tres conjuntos de datos representativos de juegos de rol, InCharacter, CharacterEval y Character-LLM, y demostramos que nuestro marco RAG Emocional supera significativamente a los métodos que no tienen en cuenta las emociones a la hora de preservar los rasgos de personalidad de los agentes de los juegos de rol.

Arquitectura general del GAR emocional

En esta sección, presentamos en primer lugar la arquitectura general de nuestro marco de juego de rol emocional RAG y, a continuación, describimos cada componente en detalle.

El objetivo de los agentes de juegos de rol es imitar las respuestas humanas en la generación de diálogos. Los agentes están dirigidos por grandes modelos lingüísticos (LLM) y son capaces de generar respuestas basadas en el contexto del diálogo. Como se muestra en la Fig. 1 Como se muestra, en el caso de que el agente tenga que responder a una consulta, el marco que proponemos para los agentes emocionales RAG contiene cuatro componentes: el componente de codificación de la consulta, el componente de construcción de la memoria, el componente de recuperación de la emoción y el componente de generación de la respuesta. El papel de cada componente es el siguiente:

Componente de codificación de la consulta: en este componente, los estados semántico y de sentimiento de la consulta se codifican como vectores.
Componente de codificación de la memoria: la unidad de memoria almacena información sobre el diálogo del personaje. De forma similar a la codificación de consultas, se codifican los estados semánticos y afectivos de los recuerdos.
Componente de recuperación emocional: simula el recuerdo en la unidad de memoria humana y, a continuación, proporciona recuerdos emocionalmente congruentes para mejorar el proceso de generación de LLM.
Componente de generación de respuestas: para generar una respuesta, se introduce en el agente de juegos de rol una plantilla que contiene información sobre la consulta, los perfiles de rol y los recuerdos emocionales recuperados.

Componente de codificación de consultas

importación: Texto de consulta del usuario
exportacionesvector semántico $\textbf{semántico}_q$ y vector de sentimiento $\textbf{emoción}_q$ para la consulta
metodologías::
- El texto de la consulta se convierte en un vector semántico de 768 dimensiones mediante un modelo de incrustación (por ejemplo, bge-base-zh-v1.5).
- Convierte el texto de la consulta en un sentimiento de 8 dimensiones (que contiene 8 estados de sentimiento) utilizando GPT-3.5 y la plantilla de pistas de sentimiento.

componente de codificación de la memoria

importaciónMemorizar la información del diálogo del módulo
exportaciones: Vector Semántico $\textbf{semantic}_m^k$ y Vector de Emoción $\textbf{emotion}_m^k$ para Fragmentos de Memoria
metodologías::
- El texto del diálogo se convierte en vectores semánticos utilizando el mismo modelo de incrustación que el componente de codificación de la consulta.
- El texto se convierte en vectores de sentimiento utilizando las mismas plantillas GPT-3.5 y de indicios de sentimiento que el componente de codificación de consultas.

Fig. 2: Plantilla para la puntuación del sentimiento en un gran modelo lingüístico.

Traducción al chino:

### 任务描述
你是一位情感分析大师，能够仔细辨别每位面试官问题中隐含的细微情感。这种情感能够引导参与者回忆起具有类似情感的事件，从而更好地回答问题。
### 评分标准
假设每个问题包含八种基本情感，包括喜悦（joy）、接纳（acceptance）、恐惧（fear）、惊讶（surprise）、悲伤（sadness）、厌恶（disgust）、愤怒（anger）和期待（anticipation）。
接下来我将输入一个问题，你的任务是对这八种情感维度中的每一种进行评分，评分范围为 1 到 10，其中较高的分数表示该问题更强烈地表现了这一情感维度。
### 输出格式
分析面试官问题在这八种情感维度上的表现，给出原因和评分，并以 Python 列表的形式输出，如下所示：
```python
[
{"analysis": <原因>, "dim": "joy", "score": <分数>},
{"analysis": <原因>, "dim": "acceptance", "score": <分数>},
...
{"analysis": <原因>, "dim": "anticipation", "score": <分数>}
]
```
你的回答必须是有效的 Python 列表，以便可以直接在 Python 中解析，无需额外内容！给出的结果需要尽可能准确，并符合大多数人的直觉。

Componente de recuperación del sentimiento

importación: vector semántico $\textbf{semántico}_q$, vector emoción $\textbf{emoción}_q$ de la consulta, y vector semántico $\textbf{semántico}_m^k$ en la unidad de memoria, vector emoción $\textbf{ emoción}_m^k$ emoción}_m^k$
exportacionesel segmento de memoria más relevante para la consulta
metodologías::
- Calcular la similitud entre la consulta y el segmento de memoria mediante la distancia euclidiana.
- La distancia coseno se utilizó para calcular la similitud de sentimiento entre la consulta y el segmento de memoria.
- La similitud semántica y la similitud de sentimiento se fusionan para calcular la puntuación final de similitud.
- La recuperación se realiza mediante dos estrategias (estrategia combinada y estrategia secuencial).

Componente de generación de respuestas

importación: Segmentos de memoria recuperados, información de rol e información de consulta
exportacionesRespuesta generada por la función
metodologías::
- Generar una respuesta utilizando una plantilla de solicitud LLM (como ChatGLM, Qwen o GPT).

Tras obtener los recuerdos recuperados, diseñamos una plantilla de pistas para el Modelo de Lenguaje Amplio (LLM) para agentes de juegos de rol. La plantilla se muestra en la figura 3. La consulta, la información del rol, el fragmento de memoria recuperado y la descripción de la tarea se formatean en la plantilla que se envía al LLM.

Figura 3: Ejemplo de plantilla de respuesta del conjunto de datos CharacterEval.

Traducción al chino:

[角色信息] 
--- 
{role_information} 
---

[记忆内容] 
--- 
{memory_fragments} 
---

角色信息包含有关 {role} 的一些基本信息。 
记忆内容是由 {role} 回忆出的与当前问题相关的内容。

现在你是 {role}，请模仿 {role} 的语气和说话方式，参考角色信息和记忆内容来回答面试官的问题。 
请不要偏离角色，绝对不要说自己是人工智能助手。

以下是面试官的问题： 
面试官：{question}

prueba

Realizamos experimentos con tres conjuntos de datos públicos para evaluar la capacidad de juego de rol de un modelo lingüístico ampliado con memoria emocional.

Hemos realizado experimentos con tres conjuntos de datos de juegos de rol de acceso público: InCharacter, CharacterEval y Character-LLM. Sus estadísticas se resumen en la Tabla I Medio.

Conjunto de datos InCharacter: Este conjunto de datos contiene 32 caracteres. Estos caracteres provienen de ChatHaruhi [3], RoleLLM [5] y C.AI11 https://github.com/kramcat/CharacterAI. cada personaje está asociado a una unidad de memoria que contiene diálogos de escenas icónicas con una duración media de 337.
Conjunto de datos CharacterEval: este conjunto de datos contiene 77 personajes únicos y 4.564 pares de preguntas y respuestas. Estos personajes proceden de conocidas películas y series de televisión chinas, y los datos de sus diálogos se han extraído de los guiones. Hemos seleccionado los 31 personajes más populares. Para cada personaje, extrajimos todos los pares pregunta-respuesta para crear unidades de memoria, con un tamaño medio de 113.
Conjunto de datos Personaje-LLM: El conjunto de datos Personaje-LLM contiene 9 famosos personajes ingleses, por ejemplo, Beethoven, Hermione, etcétera. Sus unidades de memoria proceden de la finalización de diálogos basada en escenas (realizada por GPT). Utilizamos 1.000 diálogos de preguntas y respuestas para cada personaje.

Evaluación de los indicadores

Evaluamos la precisión de los rasgos de carácter de los agentes de rol mediante el Inventario de los Cinco Grandes (BFI) y el test de evaluación MBTI. A continuación se ofrece una descripción detallada de cada indicador de evaluación:

Inventario de los Cinco Grandes (BFI): La teoría de los Cinco Grandes es un modelo psicológico ampliamente utilizado que divide la personalidad en cinco dimensiones principales: Apertura, Conciencia, Extraversión, Agradabilidad y Neuroticismo. El Neuroticismo es una de las dimensiones más importantes de la personalidad (Amabilidad) e Inestabilidad emocional (Neuroticismo).
MBTI: es un popular test de personalidad basado en la teoría del Indicador de Tipos de Myers-Briggs (MBTI). Clasifica los tipos de personalidad de las personas en 16 combinaciones diferentes. Cada tipo está representado por cuatro letras que corresponden a las cuatro dimensiones siguientes: Extraversión (E) e Introversión (I), Sentido de la Realidad (S) e Intuición (N), Pensar (T) y Sentir (F), y Juzgar (J) y Percibir (P).

El MBTI se evalúa en una tarea de categorización de 16 tipos, mientras que el BFI predice valores para cinco dimensiones de la personalidad.Las etiquetas verdaderas para el MBTI y el BFI se recopilaron a partir de tres conjuntos de datos de un sitio web de votación de personalidades. En nuestro modelo, se pidió a los agentes de rol que respondieran a cuestionarios psicológicos abiertos diseñados para el MBTI y el BFI. Posteriormente, GPT-3.5 analizó todas las respuestas recogidas y generó las evaluaciones del MBTI y el BFI. La plantilla de evaluación de la personalidad para GPT-3.5 se muestra en la Figura 4.

Basándonos en los resultados de la evaluación, comparamos la salida de los proxies de rol con las etiquetas verdaderas para determinar los resultados de las siguientes métricas de evaluación: Precisión (Acc), es decir, Acc (Dim) y Acc (Full), Error Cuadrático Medio (MSE) y Error Absoluto Medio (MAE).Las métricas Acc (Dim) y Acc (Full) muestran la precisión de la predicción para cada dimensión y todas las combinaciones de tipos de personalidad, respectivamente. Las métricas Acc (Dim) y Acc (Full) muestran la precisión de predicción de los tipos de personalidad en cada dimensión y en todas las combinaciones, respectivamente.MSE y MAE miden el error entre las etiquetas predicha y verdadera de la personalidad de un personaje. En el conjunto de datos InCharacter, utilizamos BFI y MBTI para las pruebas, mientras que en los conjuntos de datos CharacterEval y Character-LLM, sólo se utiliza MBTI debido a la dificultad de recopilar etiquetas BFI verdaderas.

Figura 4: Ejemplo de plantilla para las dimensiones Extraversión (E) e Introversión (I) de la evaluación MBTI.

Traducción al chino:

你是心理测量学方面的专家，尤其是 16 人格测试（与 MBTI 高度相似）。我（<实验者>）正在对某人进行 16 人格测试。我通过一系列开放式问题评估他/她在 E/I 维度上的表现。以下是关于此维度的一些背景信息：

===
E/I 维度：外向（E）与内向（I）

外向（E）：外向者从与他人互动中获得能量。他们在社交环境中感到舒适，倾向于表达自己的想法。外向者通常更活跃，寻求社交刺激，并喜欢参与群体活动。对他们而言，与人建立联系、分享和交流想法往往是必要的。他们可能更关注外部世界的刺激，例如声音、色彩和社交动态。

内向（I）：内向者在独处时感到更舒适。他们从内省和个人时间中获得能量。与外向者相反，长时间的社交互动可能让他们感到疲惫。内向者可能更加内省，喜欢深度思考，并倾向于建立有意义的人际关系。他们更关注内心世界，例如想法、情感和想象力。
===

我的名字是 <实验者>。我邀请了一位参与者，<参与者>，并且我们用英语进行了许多对话。我将输入这些对话。

请帮助我评估 <参与者> 在 16 人格测试中 E/I 维度上的得分。 
你需要提供每种类型的百分比，总和为 100%，例如：30% A 和 70% B。 
请按以下 JSON 格式输出：

===
```json
{
"analysis": "<基于对话的分析>",
"result": {
"E": "<百分比 1>",
"I": "<百分比 2>"
} 
}
```
（百分比 1 和百分比 2 的总和应为 100%。输出结果需包含百分号。）

Trabajos relacionados

Agentes de juegos de rol

Los agentes de juego de rol, también conocidos como agentes conversacionales de juego de rol (RPCA), pretenden simular comportamientos y patrones conversacionales específicos de cada personaje mediante grandes modelos lingüísticos. Los agentes de juego de rol tienen un gran potencial y se espera que supongan un avance significativo en los sectores del juego, la literatura y la industria creativa [1, 2, 3, 4, 5, 6] En la actualidad, la implementación de agentes de juegos de rol puede dividirse en dos enfoques principales. La primera estrategia mejora las capacidades de interpretación de roles de los grandes modelos lingüísticos mediante técnicas de ingeniería de pistas y mejora generativa. Este enfoque introduce datos específicos del rol a través del contexto y explota las capacidades avanzadas de aprendizaje contextual de los grandes modelos lingüísticos modernos. Por ejemplo, ChatHaruhi [3] desarrollaron un sistema RAG (Retrieval Augmented Generation) que utiliza diálogos históricos de escenas icónicas, aprendidos con un pequeño número de ejemplos, para captar los rasgos de personalidad y el estilo de lenguaje de un personaje. En cambio, RoleLLM [5] introdujeron RoleGPT para diseñar avisos basados en roles para el modelo GPT.

Otro enfoque de los juegos de rol consiste en utilizar los datos recogidos sobre los personajes para preentrenar o afinar el modelo de biglengua con el fin de personalizar el modelo de biglengua para que se adapte a un escenario específico de juego de rol. En [4] en el que se utilizan datos sobre diálogos y personajes extraídos de las novelas de Harry Potter para entrenar agentes capaces de generar respuestas muy ajustadas al contexto de la escena y a las relaciones entre los personajes.Character-LLM [1Utilización ChatGPT Creación de datos de diálogos para construir escenarios y posterior entrenamiento de modelos lingüísticos utilizando meta-promptos y estos diálogos. El proyecto implementó estrategias como cargas de memoria y mejoras en la memoria de protección para mitigar el problema de la generación de incoherencias de roles en el conjunto de datos de entrenamiento del modelo.RoleLLM [5] utiliza GPT para generar pares de preguntas y respuestas basados en guiones y los presenta en un formato ternario consistente en preguntas, respuestas y niveles de confianza. La introducción de métricas de confianza mejora significativamente la calidad de los datos generados.CharacterGLM [2entrenó un modelo de roles de código abierto con datos de múltiples roles. Este enfoque incorpora el conocimiento específico del rol directamente en los parámetros del modelo.

Aunque los estudios existentes sobre agentes de juegos de rol tienen en cuenta factores como los perfiles de los personajes, las relaciones y los atributos asociados al diálogo, a menudo pasan por alto un elemento clave: el componente emocional del personaje. Nuestro marco RAG Emocional está diseñado a partir de técnicas de ingeniería de pistas que no requieren preentrenamiento ni ajuste fino del gran modelo lingüístico de los agentes de juegos de rol.

RAG basada en la memoria en la aplicación de grandes modelos lingüísticos

En los agentes inteligentes de juegos de rol, la memoria es un factor importante para que los personajes mantengan sus rasgos de personalidad. La técnica de Generación Aumentada por Recuperación (RAG) se utiliza ampliamente para acceder a recuerdos relevantes con el fin de mejorar las capacidades generativas de los agentes inteligentes de juegos de rol, lo que se denomina RAG de Memoria [35]. Por ejemplo, la bibliografía [36La arquitectura de agente automático basada en el Large Language Model (LLM) propuesta en ] consta de cuatro componentes: el módulo de perfiles, el módulo de memoria, el módulo de planificación y el módulo de acción. Entre ellos, el módulo de memoria es la pieza clave en el diseño de la arquitectura del agente inteligente. Se encarga de adquirir información del entorno y de utilizar estos recuerdos registrados para mejorar las acciones futuras. El módulo de memoria permite a los agentes inteligentes acumular experiencia, evolucionar de forma autónoma y actuar de manera más coherente, racional y eficiente [14]

La investigación sobre el diseño de la memoria en la aplicación de grandes modelos lingüísticos puede dividirse en dos categorías. La primera categoría es la captura y almacenamiento de estados intermedios durante la inferencia del modelo como contenido de memoria. Estas memorias se recuperan cuando se necesitan para apoyar la generación de la respuesta actual. Por ejemplo, MemTRM [37MemTRM] aplica un mecanismo de atención híbrido tanto a la entrada actual como a la memoria pasada, conservando los pares clave-valor anteriores y realizando una búsqueda del vecino más próximo utilizando el vector de consulta de la entrada actual. Sin embargo, MemTRM se enfrenta al problema de la obsolescencia de la memoria durante el entrenamiento. Para resolverlo, se ha desarrollado LongMEM [38] separa el almacenamiento de la memoria del proceso de recuperación. Esta estrategia es especialmente adecuada para modelos de código abierto y puede requerir un entrenamiento adaptativo para integrar eficazmente el contenido del banco de memoria. La segunda clase de soluciones de diseño de memoria proporciona soporte de memoria a través de bancos de memoria externos. Los bancos de memoria externos pueden adoptar diversas formas para mejorar la capacidad del sistema para gestionar y recuperar información. Por ejemplo, MemoryBank [10AI-town[] almacena diálogos pasados, resúmenes de eventos y características del usuario en forma de biblioteca vectorial. El proceso de recuperación de la memoria se acelera enormemente gracias al cálculo de similitudes vectoriales, lo que permite acceder rápidamente a experiencias y datos pasados relevantes.AI-town[12] utiliza un enfoque de lenguaje natural para la conservación de la memoria e introduce un mecanismo de reflexión que transforma las observaciones simples en reflexiones más abstractas y de orden superior en determinadas condiciones. Este sistema tiene en cuenta tres factores clave en el proceso de recuperación: la relevancia de la memoria, la oportunidad y la importancia, garantizando así que se recupere la información más relevante y contextualmente significativa para la interacción actual.

En los agentes de juegos de rol basados en grandes modelos lingüísticos, las unidades de memoria suelen adoptar un segundo enfoque, potenciando la autenticidad del personaje mediante un banco de memoria externo. Por ejemplo, en el sistema ChatHaruhi, el agente de juegos de rol enriquece el desarrollo y la interacción del personaje recuperando diálogos de escenas icónicas. A pesar de la amplia investigación en técnicas de RAG de memoria, la forma de lograr respuestas más identificadas con los humanos sigue siendo un campo poco explorado y abierto. Inspirándonos en la investigación cognitiva en psicología, hacemos el primer intento de incorporar factores emocionales al proceso de recuperación de la memoria para imitar los procesos cognitivos humanos, haciendo así que las respuestas del gran modelo lingüístico sean más emocionalmente resonantes y humanas.

llegar a un veredicto

En este artículo, hacemos el primer intento de introducir la memoria emocional para mejorar el rendimiento de los agentes de juegos de rol. Proponemos un novedoso marco de RAG afectiva que contiene cuatro estrategias de recuperación para hacer que los agentes de juegos de rol sean más emocionales y humanos en el diálogo. Amplios resultados experimentales en tres conjuntos de datos públicos para una amplia gama de personajes demuestran la eficacia de nuestro enfoque para mantener los rasgos de personalidad de los personajes. Creemos que incorporar la emoción a los agentes de juegos de rol es una dirección de investigación clave. En el estudio actual, realizamos un GAR afectivo basado en mecanismos de memoria intuitiva. en futuros trabajos, intentaremos incorporar factores emocionales a esquemas más avanzados de organización y recuperación de la memoria.