Endereço para correspondência: https://arxiv.org/abs/2404.17723
Os gráficos de conhecimento só podem extrair relacionamentos de entidades de forma direcionada, e esses relacionamentos de entidades extraíveis de forma estável podem ser entendidos comoAbordagem de dados estruturados.
A Figura 1 ilustra o fluxo de trabalho de um sistema de perguntas e respostas de atendimento ao cliente que combina Knowledge Graph (KG) e Retrieval Augmented Generation (RAG). O processo está resumido abaixo:
1. mapeamento de conhecimento: o sistema constrói um mapa de conhecimento abrangente a partir do histórico de tíquetes de problemas de atendimento ao cliente, incluindo duas etapas principais:
- Representação em árvore do tíquete interno: cada tíquete de problema é analisado como uma estrutura em árvore com nós que representam diferentes partes do tíquete (por exemplo, resumo, descrição, prioridade etc.).
- Vinculação entre tíquetes: conexão de árvores de tíquetes individuais em um gráfico completo com base em vinculação explícita em tíquetes de rastreamento de problemas e vinculação implícita deduzida por meio de similaridade semântica.
2. geração de incorporação: gera vetores de incorporação para nós no gráfico, usando modelos de incorporação de texto pré-treinados (por exemplo, BERT ou E5), e armazena essas incorporações em um banco de dados de vetores.
3. processo de pesquisa e de perguntas e respostas:
- Incorporação de intenções de perguntas: análise de consultas de usuários para identificar entidades e intenções nomeadas.
- Recuperação baseada em incorporação: use entidades para recuperar os tíquetes mais relevantes e filtrar os subgráficos relevantes.
- Filtragem: triagem adicional e identificação das informações mais relevantes.
4. tíquetes recuperados: o sistema recupera tíquetes específicos relacionados à consulta do usuário, como ENT-22970, PORT-133061, ENT-1744 e ENT-3547, e exibe as relações de clonagem (CLONE_FROM/CLONE_TO) e similaridade (SIMILAR_TO) entre eles.
5 Geração de respostas: por fim, o sistema sintetizará as informações recuperadas e a consulta original do usuário para gerar uma resposta por meio de um modelo de linguagem grande (LLM).
6 Banco de dados de gráficos e banco de dados de vetores: durante todo o processo, o banco de dados de gráficos é usado para armazenar e gerenciar os nós e links no atlas, enquanto o banco de dados de vetores é usado para armazenar e gerenciar os vetores de incorporação de texto dos nós.
7 Etapas do uso do LLM: em várias etapas, modelos de linguagem grandes são usados para analisar o texto, gerar consultas, extrair subgrafos e gerar respostas.
Esse fluxograma oferece uma visão de alto nível de como a eficiência e a precisão dos sistemas automatizados de perguntas e respostas para atendimento ao cliente podem ser aprimoradas pela combinação de técnicas de geração de gráficos de conhecimento e aprimoramento de recuperação.