RAG émotionnel : l'intelligence au service d'un jeu de rôle amélioré grâce à la récupération émotionnelle

Base de connaissances sur l'IAPosté il y a 9 mois Cercle de partage de l'IA

10.1K 00

résumés

Le domaine de la recherche sur les jeux de rôle visant à générer des réponses semblables à celles des humains a attiré une attention croissante, car les grands modèles de langage (LLM) ont démontré un degré élevé de capacités semblables à celles des humains. Cela a facilité l'exploration des agents de jeu de rôle dans une variété d'applications, telles que les chatbots qui peuvent s'engager dans des conversations naturelles avec les utilisateurs, et les assistants virtuels qui peuvent fournir une assistance et des conseils personnalisés. Un élément clé des tâches de jeu de rôle est l'utilisation efficace de la mémoire du personnage, qui stocke son profil, ses expériences et son dialogue historique. Pour améliorer la génération de réponses des agents de jeux de rôle, des techniques de génération augmentée par récupération (RAG) sont utilisées pour accéder aux mémoires pertinentes. La plupart des études actuelles récupèrent les informations pertinentes sur la base de la similarité sémantique des souvenirs afin de maintenir les caractéristiques personnalisées du personnage, alors que peu de tentatives ont été faites pour utiliser la LLM dans le jeu de rôle. RAG Nous proposons une nouvelle théorie de la mémoire consciente des émotions, inspirée de la théorie de la "mémoire dépendante des émotions" (selon laquelle les gens se souviennent mieux des événements s'ils réactivent leurs émotions d'origine pendant l'apprentissage). Inspirés par la théorie de la "mémoire dépendante des émotions" (selon laquelle les gens se souviennent mieux des événements si l'émotion initiale au moment de l'apprentissage est réactivée au moment du rappel), nous proposons un nouveau cadre de récupération de la mémoire tenant compte des émotions, appelé Emotional RAG (Emotional RAG). "Nous proposons un nouveau cadre de récupération de la mémoire tenant compte des émotions, appelé RAG émotionnel (Emotional RAG), qui prend en compte les états émotionnels des agents jouant un rôle pour rappeler les souvenirs pertinents. Plus précisément, nous concevons deux stratégies de récupération, à savoir la stratégie de combinaison et la stratégie de séquence, pour combiner la sémantique de la mémoire et les états affectifs dans le processus de récupération. Des expériences approfondies sur trois ensembles de données représentatifs de jeux de rôle montrent que notre cadre RAG émotionnel est plus performant pour préserver l'individualité des personnages que les approches qui ne prennent pas en compte les émotions. Cela confirme la théorie de la mémoire dépendante de l'émotion en psychologie. Notre code est accessible au public à l'adresse https://github.com/BAI-LAB/EmotionalRAG.

Conclusions importantes :
L'intégration des états émotionnels dans la récupération de la mémoire renforce la cohérence de la personnalité
La théorie de la mémoire dépendante des émotions en psychologie peut être appliquée aux agents d'intelligence artificielle
Différentes stratégies de recherche sont plus efficaces pour différents indicateurs d'évaluation de la personnalité.
La cohérence émotionnelle améliore l'humanisation des réponses générées

RAG émotionnel, agents de jeu de rôle, modélisation en langage large

Fig. 1 : Architecture générale du cadre du RAG émotionnel. Il se compose de quatre éléments : un élément d'encodage des requêtes, un élément d'encodage des souvenirs, un élément de récupération des émotions et un élément de génération de réponses. Les souvenirs émotionnels récupérés par Emotional RAG sont envoyés au LLM avec le profil de rôle et la requête afin de générer une réponse.

doctrinal

Alors que l'intelligence artificielle continue d'évoluer dans les grands modèles de langage (LLM), ces derniers présentent un degré élevé de capacités semblables à celles de l'homme. L'utilisation des LLM comme agents de jeu de rôle, qui imitent les réponses humaines, a démontré une forte capacité à générer des réponses qui maintiennent les caractéristiques personnalisées du personnage. Les agents de jeux de rôle ont été utilisés dans plusieurs domaines tels que les agents de service à la clientèle et les guides touristiques. Ces agents ont montré un grand potentiel dans les applications commerciales et ont attiré une attention croissante dans la recherche LLM.

Afin de maintenir les caractéristiques et les capacités personnalisées d'un rôle, le facteur le plus important est la mémoire. Les agents de jeu de rôle accèdent aux données historiques telles que les profils d'utilisateurs, les expériences d'événements, les conversations récentes, etc. en effectuant des recherches dans leurs unités de mémoire afin de fournir des informations personnalisées riches aux LLM dans les tâches de jeu de rôle. Les techniques de génération augmentée par récupération (RAG) sont utilisées pour accéder aux mémoires pertinentes afin d'augmenter la génération de réponses de l'agent de jeu de rôle, appelée RAG mémoire.

Divers mécanismes de mémoire ont été utilisés dans différentes applications LLM. Par exemple, la courbe d'oubli d'Ebbinghaus a inspiré le développement de MemoryBank, qui facilite la réalisation de schémas de mémoire plus proches de ceux des humains. En outre, sur la base de la théorie du double processus de Kahneman, le cadre MaLP introduit un mécanisme innovant d'amélioration de la mémoire à double processus qui intègre efficacement la mémoire à long terme et la mémoire à court terme.

Alors que la recherche a démontré l'efficacité de l'utilisation de la mémoire dans les applications de modélisation linguistique à grande échelle (LLM) décrites ci-dessus, l'obtention de réponses plus humaines de la part des agents de jeu de rôle reste un domaine de recherche qui n'a pas encore été pleinement exploré. Inspirés par la recherche cognitive en psychologie, nous avons tenté pour la première fois de simuler les processus cognitifs humains pendant le rappel de souvenirs. Basée sur la théorie de la mémoire dépendante des émotions proposée par le psychologue Gordon H. Bower en 1981 :Les gens se souviennent mieux des événements lorsqu'ils retrouvent d'une manière ou d'une autre les émotions brutes qu'ils ont ressenties au cours du processus d'apprentissage.. En provoquant expérimentalement des émotions joyeuses ou tristes chez des sujets afin d'explorer les effets des émotions sur la mémoire et la pensée, il a constaté que les émotions déterminent non seulement le choix des informations rappelées, mais aussi la manière dont les souvenirs sont récupérés. Cela suggère que les individus sont plus susceptibles de se souvenir d'informations qui sont cohérentes avec leur état émotionnel du moment.

Sur la base de la théorie de la mémoire dépendante des émotions en psychologie, nous proposons un nouveau cadre de récupération de la mémoire tenant compte des émotions, appelé RAG émotionnel, pour améliorer le processus de génération de réponses des agents de jeux de rôle. Dans Emotional RAG, la récupération des souvenirs suit le critère de cohérence émotionnelle, ce qui signifie que la pertinence sémantique des souvenirs rappelés et l'état émotionnel sont pris en compte dans le processus de récupération. Plus précisément, nous avons conçu deux stratégies de récupération flexibles, à savoir la stratégie de combinaison et la stratégie de séquence, pour combiner les états sémantiques et émotionnels des souvenirs dans le processus de RAG. En utilisant le RAG émotionnel, l'agent de jeu de rôle est capable de présenter des qualités plus humaines, ce qui améliore l'interactivité et l'attractivité du grand modèle linguistique. Les contributions de ce document sont résumées ci-dessous :

Inspirés par la théorie de la mémoire dépendante des émotions, nous tentons pour la première fois de modéliser les processus cognitifs humains en introduisant un effet de cohérence émotionnelle dans la mémoire d'un agent de jeu de rôle. Nous démontrons de manière exhaustive l'efficacité de l'application de la théorie de la mémoire émotionnelle de Bower au développement de l'intelligence artificielle, ce qui apporte des preuves supplémentaires à la théorie de la mémoire dépendante des émotions en psychologie.
Nous proposons un nouveau cadre de récupération de la mémoire tenant compte des émotions, appelé Emotional RAG, qui rappelle les souvenirs pertinents en fonction de la pertinence sémantique et des états émotionnels dans un agent jouant un rôle. En outre, nous proposons des stratégies de récupération flexibles, c'est-à-dire des stratégies combinatoires et séquentielles, pour fusionner les états sémantiques et émotionnels des souvenirs pendant la récupération.
Nous avons mené des expériences approfondies sur trois ensembles de données représentatifs de jeux de rôle, InCharacter, CharacterEval et Character-LLM, et nous avons montré que notre cadre RAG émotionnel est nettement plus performant que les méthodes qui ne tiennent pas compte des émotions pour préserver les traits de personnalité des agents de jeux de rôle.

Architecture générale du RAG émotionnel

Dans cette section, nous présentons d'abord l'architecture générale de notre cadre de jeu de rôle RAG émotionnel, puis nous décrivons chaque composant en détail.

L'objectif des agents de jeu de rôle est d'imiter les réponses humaines dans la génération de dialogues. Les agents sont pilotés par de grands modèles linguistiques (LLM) et sont capables de générer des réponses basées sur le contexte du dialogue. Comme le montre la Fig. 1 Comme nous l'avons montré, dans le cas où l'agent doit répondre à une requête, le cadre que nous proposons pour les agents de jeu de rôle RAG émotionnel contient quatre composants, à savoir le composant d'encodage de la requête, le composant de construction de la mémoire, le composant de récupération de l'émotion et le composant de génération de la réponse. Le rôle de chaque composante est le suivant :

Composant d'encodage de la requête : dans ce composant, les états sémantiques et sentimentaux de la requête sont encodés sous forme de vecteurs.
Composante d'encodage de la mémoire : l'unité de mémoire stocke des informations sur le dialogue du rôle. Comme pour l'encodage des requêtes, les états sémantiques et affectifs des souvenirs sont encodés.
Composante de récupération émotionnelle : elle simule le rappel dans l'unité de mémoire humaine et fournit ensuite des souvenirs émotionnellement congruents pour améliorer le processus de génération de LLM.
Composant de génération de réponses : un modèle d'invite contenant des informations de requête, des profils de rôle et des souvenirs émotionnels récupérés est entré dans l'agent de jeu de rôle pour générer une réponse.

Composant de codage des requêtes

importationTexte de la requête de l'utilisateur
exportationsvecteur sémantique $\textbf{semantic}_q$ et vecteur sentiment $\textbf{emotion}_q$ pour la requête
les méthodologies: :
- Le texte de la requête est converti en un vecteur sémantique à 768 dimensions à l'aide d'un modèle d'intégration (par exemple, bge-base-zh-v1.5).
- Convertir le texte de la requête en un sentiment à 8 dimensions (contenant 8 états de sentiment) à l'aide de GPT-3.5 et du modèle d'indices de sentiment.

composante de codage de la mémoire

importationMémoriser les informations contenues dans le dialogue du module
exportationsVecteur sémantique $\textbf{semantic}_m^k$ et vecteur émotionnel $\textbf{emotion}_m^k$ pour les fragments de mémoire
les méthodologies: :
- Le texte du dialogue est converti en vecteurs sémantiques à l'aide du même modèle d'intégration que le composant d'encodage des requêtes.
- Le texte est converti en vecteurs de sentiment en utilisant les mêmes modèles de GPT-3.5 et d'indices de sentiment que la composante d'encodage des requêtes.

Fig. 2 : Modèle pour l'évaluation des sentiments dans un grand modèle linguistique.

Traduction en chinois :

### 任务描述
你是一位情感分析大师，能够仔细辨别每位面试官问题中隐含的细微情感。这种情感能够引导参与者回忆起具有类似情感的事件，从而更好地回答问题。
### 评分标准
假设每个问题包含八种基本情感，包括喜悦（joy）、接纳（acceptance）、恐惧（fear）、惊讶（surprise）、悲伤（sadness）、厌恶（disgust）、愤怒（anger）和期待（anticipation）。
接下来我将输入一个问题，你的任务是对这八种情感维度中的每一种进行评分，评分范围为 1 到 10，其中较高的分数表示该问题更强烈地表现了这一情感维度。
### 输出格式
分析面试官问题在这八种情感维度上的表现，给出原因和评分，并以 Python 列表的形式输出，如下所示：
```python
[
{"analysis": <原因>, "dim": "joy", "score": <分数>},
{"analysis": <原因>, "dim": "acceptance", "score": <分数>},
...
{"analysis": <原因>, "dim": "anticipation", "score": <分数>}
]
```
你的回答必须是有效的 Python 列表，以便可以直接在 Python 中解析，无需额外内容！给出的结果需要尽可能准确，并符合大多数人的直觉。

Composant de recherche de sentiments

importation: vecteur sémantique $\textbf{sémantique}_q$, vecteur émotion $\textbf{émotion}_q$ de la requête, et vecteur sémantique $\textbf{sémantique}_m^k$ dans l'unité de mémoire, vecteur émotion $\textbf{ émotion}_m^k$
exportationsle segment de mémoire le plus pertinent par rapport à la requête
les méthodologies: :
- Calculer la similarité entre la requête et le segment de mémoire à l'aide de la distance euclidienne.
- La distance cosinus a été utilisée pour calculer la similitude des sentiments entre la requête et le segment de mémoire.
- La similarité sémantique et la similarité des sentiments sont fusionnées pour calculer le score de similarité final.
- La recherche est effectuée à l'aide de deux stratégies de recherche (stratégie combinée et stratégie séquentielle).

Composant de génération de réponses

importationLes segments de mémoire, les informations sur les rôles et les informations sur les requêtes ont été récupérés.
exportationsRéponse générée par le rôle : Réponse générée par le rôle
les méthodologies: :
- Générer une réponse à l'aide d'un modèle d'invite LLM (tel que ChatGLM, Qwen ou GPT).

Après avoir obtenu les souvenirs récupérés, nous avons conçu un modèle de repères pour le grand modèle linguistique (LLM) destiné aux agents de jeu de rôle. Le modèle de repère est illustré à la figure 3. La requête, les informations sur le rôle, le fragment de mémoire récupéré et la description de la tâche sont formatés dans le modèle envoyé au LLM.

Figure 3 : exemple de modèle d'invite à la génération de réponses tiré de l'ensemble de données CharacterEval.

Traduction en chinois :

[角色信息] 
--- 
{role_information} 
---

[记忆内容] 
--- 
{memory_fragments} 
---

角色信息包含有关 {role} 的一些基本信息。 
记忆内容是由 {role} 回忆出的与当前问题相关的内容。

现在你是 {role}，请模仿 {role} 的语气和说话方式，参考角色信息和记忆内容来回答面试官的问题。 
请不要偏离角色，绝对不要说自己是人工智能助手。

以下是面试官的问题： 
面试官：{question}

test

Nous menons des expériences sur trois ensembles de données accessibles au public afin d'évaluer les capacités de jeu de rôle d'un grand modèle linguistique enrichi d'une mémoire émotionnelle.

Nous avons mené des expériences sur trois ensembles de données de jeux de rôle accessibles au public, à savoir InCharacter, CharacterEval et Character-LLM. I Au milieu.

Jeu de données InCharacter : Ce jeu de données contient 32 caractères. Ces caractères proviennent de ChatHaruhi [3], RoleLLM [5] et C.AI11 https://github.com/kramcat/CharacterAI. Chaque personnage est associé à une unité de mémoire contenant des dialogues de scènes emblématiques d'une durée moyenne de 337.
Ensemble de données CharacterEval : cet ensemble de données contient 77 personnages uniques et 4 564 paires de questions-réponses. Ces personnages sont issus de films et de séries télévisées chinoises bien connus, et leurs données de dialogue sont extraites des scénarios. Nous avons sélectionné les 31 personnages les plus populaires. Pour chaque personnage, nous avons extrait toutes les paires question-réponse pour créer des unités de mémoire, d'une taille moyenne de 113.
Ensemble de données Character-LLM : l'ensemble de données Character-LLM contient 9 personnages anglais célèbres, par exemple Beethoven, Hermione, etc. Leurs unités de mémoire proviennent de la complétion de dialogues basée sur des scènes (réalisée par GPT). Nous utilisons 1 000 dialogues Q&R pour chaque personnage.

Évaluation des indicateurs

Nous avons évalué la précision des traits de caractère des agents de rôle à l'aide de l'inventaire Big Five (BFI) et du test d'évaluation MBTI. Une description détaillée de chaque indicateur d'évaluation est fournie ci-dessous :

Inventaire Big Five (BFI) : La théorie des Big Five est un modèle psychologique largement utilisé qui divise la personnalité en cinq dimensions principales : l'ouverture, la conscience, l'extraversion, l'agréabilité et le neuroticisme. L'inventaire des cinq grands (Big Five Inventory) est un modèle psychologique largement utilisé qui divise la personnalité en cinq dimensions principales : l'ouverture, la conscience, l'extraversion, l'amabilité et le neuroticisme.)
MBTI : est un test de personnalité populaire basé sur la théorie de l'indicateur de type Myers-Briggs (MBTI). Il classe les types de personnalité en 16 combinaisons différentes. Chaque type est représenté par quatre lettres correspondant aux quatre dimensions suivantes : Extraversion (E) et Introversion (I), Sens de la réalité (S) et Intuition (N), Pensée (T) et Sentiment (F), et Jugement (J) et Perception (P).

Le MBTI est évalué sur une tâche de catégorisation de 16 types, tandis que le BFI prédit les valeurs de cinq dimensions de la personnalité. Les véritables étiquettes du MBTI et du BFI ont été collectées à partir de trois ensembles de données provenant d'un site web de vote sur la personnalité. Dans notre modèle, les agents de rôle ont été invités à répondre à des questionnaires psychologiques ouverts conçus pour le MBTI et le BFI. Par la suite, toutes les réponses collectées ont été analysées par GPT-3.5 et les évaluations du MBTI et du BFI ont été générées.Le modèle d'évaluation de la personnalité pour GPT-3.5 est illustré à la figure 4.

Sur la base des résultats de l'évaluation, nous avons comparé les résultats des substituts de rôle avec les vraies étiquettes pour déterminer les résultats des mesures d'évaluation suivantes : précision (Acc), c'est-à-dire Acc (Dim) et Acc (Full), erreur quadratique moyenne (MSE) et erreur absolue moyenne (MAE).Les mesures Acc (Dim) et Acc (Full) montrent la précision de prédiction pour chaque dimension et toutes les combinaisons de types de personnalité, respectivement. Les mesures Acc (Dim) et Acc (Full) indiquent la précision de prédiction pour chaque dimension et toutes les combinaisons de types de personnalité, respectivement. Les mesures MSE et MAE mesurent l'erreur entre les étiquettes prédites et vraies de la personnalité d'un personnage. Dans l'ensemble de données InCharacter, nous utilisons BFI et MBTI pour les tests, tandis que dans les ensembles de données CharacterEval et Character-LLM, seul MBTI est utilisé en raison de la difficulté à collecter les véritables étiquettes BFI.

Figure 4 : Exemple de modèle de question pour les dimensions Extraversion (E) et Introversion (I) de l'évaluation MBTI.

Traduction en chinois :

你是心理测量学方面的专家，尤其是 16 人格测试（与 MBTI 高度相似）。我（<实验者>）正在对某人进行 16 人格测试。我通过一系列开放式问题评估他/她在 E/I 维度上的表现。以下是关于此维度的一些背景信息：

===
E/I 维度：外向（E）与内向（I）

外向（E）：外向者从与他人互动中获得能量。他们在社交环境中感到舒适，倾向于表达自己的想法。外向者通常更活跃，寻求社交刺激，并喜欢参与群体活动。对他们而言，与人建立联系、分享和交流想法往往是必要的。他们可能更关注外部世界的刺激，例如声音、色彩和社交动态。

内向（I）：内向者在独处时感到更舒适。他们从内省和个人时间中获得能量。与外向者相反，长时间的社交互动可能让他们感到疲惫。内向者可能更加内省，喜欢深度思考，并倾向于建立有意义的人际关系。他们更关注内心世界，例如想法、情感和想象力。
===

我的名字是 <实验者>。我邀请了一位参与者，<参与者>，并且我们用英语进行了许多对话。我将输入这些对话。

请帮助我评估 <参与者> 在 16 人格测试中 E/I 维度上的得分。 
你需要提供每种类型的百分比，总和为 100%，例如：30% A 和 70% B。 
请按以下 JSON 格式输出：

===
```json
{
"analysis": "<基于对话的分析>",
"result": {
"E": "<百分比 1>",
"I": "<百分比 2>"
} 
}
```
（百分比 1 和百分比 2 的总和应为 100%。输出结果需包含百分号。）

Travaux connexes

Agents de jeux de rôle

Les agents de jeu de rôle (RPA), également connus sous le nom d'agents conversationnels de jeu de rôle (RPCA), visent à simuler des comportements et des modèles de conversation spécifiques à un personnage au moyen de grands modèles de langage. Les agents de jeu de rôle présentent un grand potentiel et devraient faire progresser de manière significative les secteurs de l'industrie du jeu, de la littérature et de la création [1, 2, 3, 4, 5, 6] Actuellement, la mise en œuvre d'agents de jeu de rôle peut être divisée en deux approches principales. La première stratégie améliore les capacités de jeu de rôle des grands modèles linguistiques grâce à l'ingénierie des indices et aux techniques d'amélioration générative. Cette approche introduit des données spécifiques au rôle par le biais du contexte et exploite les capacités avancées d'apprentissage du contexte des grands modèles linguistiques modernes. Par exemple, ChatHaruhi [3a mis au point un système RAG (Retrieval Augmented Generation) qui utilise les dialogues historiques de scènes emblématiques, appris à partir d'un petit nombre d'exemples, afin de saisir les traits de personnalité et le style de langage d'un personnage. En revanche, RoleLLM [5La méthode RoleGPT a été introduite pour concevoir des messages-guides basés sur les rôles dans le cadre du modèle GPT.

Une autre approche du jeu de rôle consiste à utiliser les données collectées sur les personnages pour pré-entraîner ou affiner le modèle biglangue afin de l'adapter à un scénario de jeu de rôle spécifique. Dans [4] dans lequel les données sur les dialogues et les personnages extraites des romans Harry Potter sont utilisées pour former des agents capables de générer des réponses fortement adaptées au contexte de la scène et aux relations entre les personnages.Character-LLM [1Utilisation ChatGPT Création de données de dialogue pour élaborer des scénarios et formation ultérieure de modèles linguistiques à l'aide de méta-prompts et de ces dialogues. Le projet a mis en œuvre des stratégies telles que le téléchargement de mémoire et l'amélioration de la mémoire de protection pour atténuer le problème de la génération d'incohérences de rôle dans l'ensemble de données d'apprentissage du modèle.5Le GPT utilise GPT pour générer des paires de questions-réponses basées sur des scripts et les présente dans un format ternaire composé de questions, de réponses et de niveaux de confiance. L'introduction de mesures de confiance améliore considérablement la qualité des données générées.CharacterGLM [2Dans le cadre de l'étude sur les rôles, un modèle de rôle à source ouverte a été formé à l'aide de données multirôles. Cette approche intègre des connaissances spécifiques aux rôles directement dans les paramètres du modèle.

Alors que les études existantes sur les agents de jeux de rôle prennent en compte des facteurs tels que les profils des personnages, les relations et les attributs associés au dialogue, elles négligent souvent un élément clé : la composante émotionnelle du personnage. Notre cadre RAG émotionnel est conçu sur la base de techniques d'ingénierie des indices qui ne nécessitent pas de pré-entraînement ou d'ajustement du grand modèle linguistique dans les agents de jeu de rôle.

RAG basé sur la mémoire dans l'application de la modélisation linguistique à grande échelle

Dans les agents intelligents de jeux de rôle, la mémoire est un facteur important qui permet aux personnages de conserver leurs traits de personnalité. La technique de génération augmentée par récupération (RAG) est largement utilisée pour accéder aux souvenirs pertinents afin d'améliorer les capacités de génération des agents intelligents de jeux de rôle, appelée RAG mémoire [35]. Par exemple, la littérature [36L'architecture d'agent automatique basée sur le Grand Modèle de Langage (LLM) proposée dans ] se compose de quatre éléments : le module de profilage, le module de mémoire, le module de planification et le module d'action. Parmi eux, le module de mémoire est l'élément clé de la conception de l'architecture d'un agent intelligent. Il est chargé d'acquérir des informations sur l'environnement et d'utiliser ces souvenirs enregistrés pour améliorer les actions futures. Le module de mémoire permet aux agents intelligents d'accumuler de l'expérience, d'évoluer de manière autonome et d'agir de manière plus cohérente, rationnelle et efficace [14]

La recherche sur la conception de la mémoire dans l'application de grands modèles de langage peut être divisée en deux catégories. La première catégorie concerne la capture et le stockage des états intermédiaires au cours de l'inférence du modèle en tant que contenu de la mémoire. Ces mémoires sont récupérées lorsque cela est nécessaire pour soutenir la génération de la réponse actuelle. Par exemple, MemTRM [37MemTRM [ ] applique le mécanisme d'attention hybride à la fois à l'entrée actuelle et à la mémoire passée en conservant les paires clé-valeur passées et en effectuant une recherche du plus proche voisin à l'aide du vecteur d'interrogation de l'entrée actuelle. Cependant, MemTRM se heurte au problème de l'obsolescence de la mémoire pendant la formation. Pour résoudre ce problème, LongMEM [38Cette stratégie est particulièrement adaptée aux modèles à source ouverte et peut nécessiter une formation adaptative pour intégrer efficacement le contenu de la banque de mémoire. Cette stratégie est particulièrement adaptée aux modèles à source ouverte et peut nécessiter une formation adaptative pour intégrer efficacement le contenu de la banque de mémoire. La deuxième catégorie de solutions de conception de la mémoire fournit un support de mémoire par le biais de banques de mémoire externes. Les banques de mémoire externes peuvent prendre diverses formes pour améliorer la capacité du système à gérer et à récupérer des informations. Par exemple, MemoryBank [10AI-town[ ] stocke les dialogues passés, les résumés d'événements et les caractéristiques de l'utilisateur sous la forme d'une bibliothèque de vecteurs. Le processus de récupération de la mémoire est grandement accéléré par le calcul de la similarité des vecteurs, ce qui rend les expériences et les données passées pertinentes rapidement accessibles.AI-town[12Ce système prend en compte trois facteurs clés dans le processus de récupération : la pertinence de la mémoire, l'actualité et l'importance, garantissant ainsi que les informations les plus pertinentes et les plus significatives dans le contexte de l'interaction en cours sont récupérées pour l'interaction actuelle. Ce système prend en compte trois facteurs clés dans le processus de récupération : la pertinence de la mémoire, l'opportunité et l'importance, garantissant ainsi que les informations les plus pertinentes et contextuellement significatives sont récupérées pour l'interaction en cours.

Dans les agents de jeu de rôle basés sur de grands modèles de langage, les unités de mémoire adoptent généralement une deuxième approche, en renforçant l'authenticité du personnage au moyen d'une banque de mémoire externe. Par exemple, dans le système ChatHaruhi, l'agent de jeu de rôle enrichit le développement du personnage et l'interaction en récupérant le dialogue de scènes emblématiques. Malgré des recherches approfondies sur les techniques de RAG de la mémoire, la manière d'obtenir des réponses mieux identifiées par l'homme reste un domaine ouvert et sous-exploré. Inspirés par des études cognitives en psychologie, nous tentons pour la première fois d'incorporer des facteurs émotionnels dans le processus de rappel de la mémoire afin d'imiter les processus cognitifs humains et de rendre ainsi les réponses du grand modèle linguistique plus résonnantes sur le plan émotionnel et plus humaines.

rendre un verdict

Dans cet article, nous tentons pour la première fois d'introduire la mémoire émotionnelle pour améliorer les performances des agents de jeu de rôle. Nous proposons un nouveau cadre RAG affectif contenant quatre stratégies de récupération pour rendre les agents de jeu de rôle plus émotionnels et humains dans le dialogue. Des résultats expérimentaux étendus sur trois ensembles de données publiques pour un large éventail de personnages démontrent l'efficacité de notre approche dans le maintien des traits de personnalité des personnages. Nous pensons que l'incorporation d'émotions dans les agents de jeu de rôle est un axe de recherche essentiel. Dans l'étude actuelle, nous avons réalisé un RAG affectif basé sur des mécanismes de mémoire intuitive. Dans nos travaux futurs, nous tenterons d'incorporer des facteurs émotionnels dans des schémas d'organisation et de récupération de la mémoire plus avancés.