Génération améliorée de graphes de connaissances Améliorations de la récupération pour le questionnaire sur le service à la clientèle
Adresse du document : https://arxiv.org/abs/2404.17723
Les graphes de connaissances ne peuvent extraire les relations entre les entités que de manière ciblée, et ces relations entre les entités qui peuvent être extraites de manière stable peuvent être définies comme suitApproche des données structurées.
La figure 1 illustre le flux de travail d'un système de questions-réponses pour le service à la clientèle qui combine le graphe de connaissances (KG) et la génération augmentée par récupération (RAG). Le processus est résumé ci-dessous :
1) Cartographie des connaissances : le système établit une cartographie complète des connaissances à partir de l'historique des tickets de service à la clientèle, en deux étapes principales :
- Représentation arborescente du ticket interne : chaque ticket est analysé sous la forme d'une structure arborescente dont les nœuds représentent les différentes parties du ticket (par exemple, le résumé, la description, la priorité, etc.)
- Liaison inter-billets : connexion d'arbres de billets individuels en un graphe complet basé sur des liens explicites dans les billets de suivi des émissions et sur des liens implicites déduits de la similarité sémantique.
2) Génération d'intégration : génère des vecteurs d'intégration pour les nœuds du graphe, à l'aide de modèles d'intégration de texte pré-entraînés (par exemple, BERT ou E5), et stocke ces intégrations dans une base de données vectorielle.
3. la recherche et le processus de questions-réponses :
- Intégration des intentions dans les questions : analyse des requêtes des utilisateurs pour identifier les entités nommées et les intentions.
- Recherche basée sur l'intégration : utiliser les entités pour extraire les billets les plus pertinents et filtrer les sous-graphes pertinents.
- Filtrage : sélection supplémentaire et identification des informations les plus pertinentes.
4. les tickets récupérés : le système récupère des tickets spécifiques liés à la requête de l'utilisateur, tels que ENT-22970, PORT-133061, ENT-1744 et ENT-3547, et affiche les relations de clonage (CLONE_FROM/CLONE_TO) et de similarité (SIMILAR_TO) entre eux.
5) Génération de réponses : à terme, le système synthétisera les informations récupérées et la requête originale de l'utilisateur pour générer une réponse à l'aide d'un modèle de langage étendu (LLM).
6) Base de données graphique et base de données vectorielle : tout au long du processus, la base de données graphique est utilisée pour stocker et gérer les nœuds et les liens dans l'atlas, tandis que la base de données vectorielle est utilisée pour stocker et gérer les vecteurs d'incorporation de texte des nœuds.
7. étapes de l'utilisation du LLM : en plusieurs étapes, de grands modèles de langage sont utilisés pour analyser le texte, générer des requêtes, extraire des sous-graphes et générer des réponses.
Cet organigramme donne une vue d'ensemble de la manière dont l'efficacité et la précision des systèmes automatisés de questions-réponses pour le service à la clientèle peuvent être améliorées en combinant les techniques de génération de graphes de connaissances et d'amélioration de la recherche.

La partie gauche de cette figure montre la construction du graphe de connaissances ; la partie droite montre le processus de recherche et de questions-réponses.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...