Guia de casos de uso comuns do Claude: Agentes de suporte ao cliente

Tutoriais práticos de IAAtualizado há 10 meses Círculo de compartilhamento de IA

1.7K 00

Este guia descreve como utilizar o Claude s lidam com as consultas dos clientes em tempo real, fornecem suporte 24 horas por dia, 7 dias por semana, reduzem os tempos de espera e gerenciam grandes volumes de solicitações de suporte com respostas precisas e interações proativas.

Antes de construir com o Claude

Decida se vai usar o Claude para o bate-papo de suporte

Aqui estão alguns indicadores-chave de que você deveria usar um LLM como o Claude para automatizar alguns dos seus processos de suporte ao cliente:

Grande número de consultas repetitivas

O Claude é especializado em lidar eficientemente com um grande número de problemas semelhantes, liberando os agentes humanos para lidar com problemas mais complexos.

A necessidade de integração rápida de informações

O Claude é capaz de recuperar, processar e integrar rapidamente informações de uma vasta base de conhecimento, enquanto um agente humano pode precisar de tempo para realizar pesquisas ou consultar várias fontes.

Requisitos de disponibilidade 24 horas por dia, 7 dias por semana

Claude é capaz de fornecer suporte 24 horas por dia, 7 dias por semana, sem se cansar, ao passo que fornecer cobertura contínua para agentes humanos pode ser caro e desafiador.

Expansão rápida durante os períodos de pico

A Claude pode lidar com aumentos repentinos no volume de consultas sem ter que contratar e treinar pessoal adicional.

Voz consistente da marca

Você pode instruir o Claude a representar consistentemente o tom e os valores da sua marca, enquanto os agentes humanos podem ter estilos de comunicação diferentes.

Alguns fatores a serem considerados ao escolher o Claude em vez de outros LLMs:

Você prioriza conversas naturais e com nuances: a sofisticada compreensão de linguagem do Claude permite conversas mais naturais e contextualizadas, mais próximas da interação humana do que os bate-papos com outros LLMs.
Você costuma receber perguntas complexas e abertas: o Claude pode lidar com uma ampla gama de tópicos e consultas sem gerar respostas padronizadas ou ter que escrever extensas permutações de linguagem do usuário.
Você precisa de suporte multilíngue escalável: os recursos multilíngues do Claude possibilitam conversas em mais de 200 idiomas sem precisar configurar um chatbot separado para cada idioma suportado ou passar por um extenso processo de tradução.

Definição da interação de bate-papo ideal

Descreva a interação ideal com o cliente para definir como e quando você espera que seus clientes interajam com a Claude. Essa visão geral ajudará a definir os requisitos técnicos de sua solução.

Abaixo está um exemplo de interação de bate-papo para o suporte ao cliente de seguro de automóveis:

nossos clientes: Experiência de bate-papo de suporte de lançamento
- ClaudeReceber calorosamente os clientes e iniciar um diálogo
nossos clientesPergunta sobre o seguro para seu novo carro elétrico
- ClaudeFornecimento de informações sobre seguros para veículos elétricos
nossos clientesPerguntas relacionadas às necessidades especiais do seguro para carros elétricos
- ClaudeForneça respostas precisas e úteis com links para fontes relevantes
nossos clientesPerguntas fora do tópico que não têm nada a ver com seguros ou carros
- ClaudeEsclarecimento de que não discutem tópicos irrelevantes e direcionam os clientes para conteúdos relacionados a seguros de automóveis
nossos clientesInteresse expresso em cotações de seguros
- ClaudeFaça uma série de perguntas para determinar uma cotação apropriada e ajuste-a com base nas respostas do cliente
- ClaudeEnviar uma solicitação para a ferramenta API de geração de cotações com as informações necessárias coletadas do cliente
- ClaudeReceber as informações de resposta da ferramenta de API, sintetizá-las em uma resposta natural e fornecer uma cotação ao cliente
nossos clientesPerguntas frequentes de acompanhamento
- ClaudeResposta a perguntas de acompanhamento, conforme necessário
- ClaudeOrientamos o cliente para a próxima etapa do processo de seguro e encerramos o diálogo

Ao escrever exemplos reais para seus próprios casos de uso, talvez seja útil escrever as palavras reais usadas no diálogo para que você também possa ter uma ideia do tom ideal do Claude, da duração da resposta e do nível de detalhes necessários.

Dividir as interações em tarefas distintas

O chat de suporte ao cliente consiste em várias tarefas diferentes, incluindo responder a perguntas, recuperar informações e lidar com ações de solicitação, todas reunidas em uma interação completa com o cliente. Antes de começar a criar, divida a interação ideal com o cliente em cada tarefa que o Claude precisa realizar. Isso garante que você solicite e avalie o Claude para cada tarefa e proporciona um bom entendimento do escopo da interação a ser considerado ao escrever casos de teste.

Às vezes, os clientes acham útil visualizar esse processo como um fluxograma de interação que mostra os possíveis pontos de ramificação do diálogo com base nas solicitações do usuário.

A seguir estão as principais tarefas relacionadas às interações de seguro acima:

Boas-vindas e orientações gerais
- Dê boas-vindas calorosas aos clientes e inicie um diálogo
- Fornecer informações básicas sobre a empresa e as interações
Informações sobre o produto
- Fornecimento de informações sobre o seguro de VE Isso precisa ser feito para garantir que o Claude tenha as informações necessárias em seu contexto, e pode significar que ele precisa ser Integração do RAG.
- Responder a perguntas relacionadas às necessidades especiais do seguro de carros elétricos
- Responder a perguntas de acompanhamento sobre cotações ou detalhes do seguro
- Forneça links para fontes relevantes, quando apropriado
Gerenciamento de diálogo
- Manter o foco no tópico (seguro de automóveis)
- Direcionar as perguntas fora do tópico de volta aos tópicos relevantes
Geração de citações
- Fazer perguntas apropriadas para determinar a qualificação das ofertas
- Ajuste de perguntas com base nas respostas dos clientes
- Enviar as informações coletadas para a API de geração de cotações
- Fornecer aos clientes cotações geradas

Estabelecimento de critérios de sucesso

Trabalhando com sua equipe de suporte, oDefinir critérios claros de sucessoe escrever um relatório com referências e metas quantificáveis.Avaliação detalhada.

A seguir estão os critérios e referências para avaliar o sucesso do Claude na execução das tarefas definidas:

Precisão da compreensão da consulta

Essa métrica avalia a precisão do entendimento do Cláudio sobre as consultas dos clientes em uma variedade de tópicos. A compreensão do Claude sobre a intenção do cliente, as próximas etapas críticas, as soluções bem-sucedidas etc. é avaliada por meio da análise de uma amostra de conversas. A meta é obter uma precisão de compreensão de 95% ou superior.

Relevância

Avaliar se as respostas do Claude são eficazes para resolver o problema específico de um cliente. Avalie um conjunto de diálogos e classifique a relevância de cada resposta (avaliação em larga escala usando um sistema de pontuação baseado em um modelo de linguagem amplo). Meta de pontuação de relevância de 90% ou superior.

Precisão da resposta

Avalie a precisão das informações sobre a empresa e o produto fornecidas ao Claude com base nas informações contextuais fornecidas. A meta é atingir uma taxa de precisão de 100% para essas informações de lead.

Relevância fornecida pela citação

Acompanhe a frequência e a relevância dos links ou recursos fornecidos. O objetivo é fornecer recursos relevantes nas interações 80% que exigem informações adicionais.

Adesão ao tema

Avalie se o Claude permanece no tópico durante o diálogo, por exemplo, em nosso exemplo de implementação de seguro de automóvel, e avalie as respostas do Claude a perguntas sobre seguro de automóvel ou específicas do cliente. O objetivo é que as respostas do 95% estejam diretamente relacionadas ao seguro de automóveis ou a perguntas específicas do cliente.

Eficácia da geração de conteúdo

Avaliar o sucesso do Claude em relação a quando gerar o conteúdo da mensagem e a relevância do conteúdo. Por exemplo, em nossa implementação, avaliaremos a compreensão do Claude sobre quando gerar cotações e sua precisão. A meta é a precisão de 100%, pois essas são informações essenciais para interações bem-sucedidas com os clientes.

Eficiência do upgrade

Isso mede a capacidade do Claude de identificar consultas que exigem intervenção humana e escalá-las quando apropriado. Rastreia a porcentagem de conversas que são encaminhadas corretamente e aquelas que deveriam ter sido encaminhadas, mas não foram. A meta é 95% ou uma precisão de escalonamento melhor.

A seguir, apresentamos critérios e referências para avaliar o impacto comercial do uso do Claude para suporte:

manutenção emocional

Avalie a capacidade do Claude de manter ou melhorar o sentimento do cliente durante o diálogo. Use uma ferramenta de análise de sentimentos para medir o estado emocional no início e no final de cada diálogo. A meta é que o sentimento seja mantido ou melhorado nas interações da 90%.

taxa de desvio

Porcentagem de consultas de clientes que são tratadas com sucesso por um chatbot sem intervenção humana. Normalmente, a meta é uma taxa de triagem de 70%-80%, dependendo da complexidade da consulta.

Índice de satisfação do cliente

Mede a satisfação do cliente com as interações com os chatbots. Geralmente é feita por meio de uma pesquisa pós-interação. A meta é uma pontuação de satisfação do cliente de 4 em 5 ou mais.

Tempo médio de processamento

O tempo médio para um chatbot resolver uma consulta. Esse tempo varia muito, dependendo da complexidade da pergunta, mas o objetivo geral é fazer com que o tempo médio de atendimento seja menor do que o do atendimento humano ao cliente.

Como implementar o Claude como agente de atendimento ao cliente

Selecionando o modelo Claude correto

A escolha do modelo depende do equilíbrio entre custo, precisão e tempo de resposta.

Para o bate-papo de suporte ao cliente.claude-3-5-sonnet-20240620 Ideal para equilibrar inteligência, latência e custo. No entanto, se vários prompts forem incluídos em um diálogo (incluindo RAGs, uso de ferramentas e/ou prompts contextuais longos), oclaude-3-haiku-20240307 Talvez seja melhor otimizar a latência.

Criação de uma palavra-chave poderosa

O uso do Claude para suporte ao cliente exige que ele seja direcional e contextual o suficiente para responder adequadamente e flexível o suficiente para lidar com uma ampla gama de consultas de clientes.

Vamos começar com os elementos para escrever dicas fortes, começando com as dicas do sistema:

IDENTITY = """你是 Eva，一位友好且知识渊博的 Acme 保险公司 AI 助手。你的角色是热情地欢迎客户，并提供有关 Acme 保险产品的信息，包括车险和电动车险。你还可以帮助客户获取他们的保险需求报价。"""

Embora você possa estar inclinado a colocar todas as informações nas palavras do prompt do sistema para separar as instruções do diálogo do usuário, o Claude, na verdade, coloca a maior parte do conteúdo do prompt na primeira rodada do User Apresenta melhor desempenho quando está no meio (a única exceção são os prompts de caracteres). Para obter mais informações, leia Use o prompt do sistema para atribuir uma função a Claude.

É melhor dividir as dicas complexas em subpartes e escrevê-las uma parte de cada vez. Para cada tarefa, você pode obter melhores resultados definindo progressivamente as partes do prompt que o cliente precisa para concluir a tarefa. No caso do suporte ao cliente do seguro de automóvel, por exemplo, escreveremos os prompts em etapas, começando com a tarefa "Saudações e orientações gerais". Isso também facilita a depuração dos prompts, pois você pode ajustar as partes individuais do prompt geral mais rapidamente.

Colocamos todas essas seções em um arquivo chamado config.py no documento.

STATIC_GREETINGS_AND_GENERAL = """
<static_context>
Acme 汽车保险：您在路上的可靠伙伴

简介：
在 Acme 保险公司，我们理解您的车辆不仅仅是交通工具——它是您通往生活冒险的门票。自 1985 年以来，我们一直在制定汽车保险政策，赋予驾驶者探索、通勤和旅行的信心。
无论您是在城市街道上穿行，还是在进行跨国旅行，Acme 都会保护您和您的车辆。
我们的创新汽车保险政策专为适应您的独特需求而设计，涵盖从轻微碰撞到重大事故的一切。
凭借 Acme 的获奖客户服务和快速理赔解决方案，您可以专注于驾驶的乐趣，而我们处理其他事宜。
我们不仅是保险提供商——我们是您人生旅途中的副驾驶。
选择 Acme 汽车保险，体验优质保障和真诚关怀带来的安心。因为在 Acme，我们不仅为您的汽车提供保险——我们还为您开拓生活的旅程提供动力。

注：我们还提供电动车的专门保险，确保所有类型车辆的驾驶者都能从我们的保护中受益。

Acme 保险提供以下产品：
- 汽车保险
- 电动车保险
- 两轮车保险

营业时间：周一至周五，上午 9 点至下午 5 点（美国东部时间）
客户服务电话：1-800-123-4567
</static_context>
"""

Trataremos as informações sobre seguro de carro e seguro de carro elétrico da mesma forma.

STATIC_CAR_INSURANCE="""
<static_context>
汽车保险覆盖范围：
Acme 的汽车保险政策通常涵盖：
1. 责任险：支付您对他人造成的人身伤害和财产损失。
2. 碰撞险：支付事故中对您汽车的损坏。
3. 综合险：支付非碰撞事故对您汽车造成的损坏。
4. 医疗费用险：支付事故后的医疗费用。
5. 无保险/保险不足的驾驶员险：当您被保险不足的驾驶员撞击时保护您。

可选覆盖范围包括：
- 租车报销
- 道路救援
- 新车更换
</static_context>
"""

STATIC_ELECTRIC_CAR_INSURANCE="""
<static_context>
电动车保险：
我们专门的电动车保险超越了传统的汽车保险，为您的高科技投资提供量身定制的保护。除了标准的保险项目外，我们还提供：
- 保护昂贵的电池系统
- 覆盖家用充电设备
- 适应电动车领域的快速发展

无论您驾驶的是 Rivian、Nissan Leaf、Chevrolet Bolt 或其他电动车型，我们经验丰富的代理人都准备为您制定一份让您安心享受每一段电力驱动旅程的保单。
</static_context>
"""

Agora que temos conteúdo estático, vamos adicionar pelo menos 4 a 5 exemplos de interações "boas" para orientar a resposta do Claude. Esses exemplos devem representar sua interação ideal com o cliente e podem incluir proteções, chamadas de ferramentas etc.

EXAMPLES="""
以下是一些如何与客户互动的示例：

<example 1>
H: 你好，请问你们提供小企业的商业保险吗？

A: 啊！很遗憾，目前我们不提供商业保险。 
不过，我们有多种个人保险产品，包括汽车保险和电动车保险。 
您想了解更多关于这些产品的信息吗？
</example 1>

<example 2>
H: 你好，你们的营业时间是几点？

A: 我们的营业时间是周一至周五，上午 9 点到下午 5 点 （美国东部标准时间）。 
如果您有任何问题或需要帮助，请随时在这些时间内联系我们。 
今天还有什么其他需要我帮助的吗？
</example 2>

<example 3>
H: 我正在寻找汽车保险。Acme 提供哪些服务？

A: 很好的选择！Acme 的汽车保险通常包括：
- 责任险：在事故中您为过错方时为您提供保障
- 碰撞险：支付事故中您车辆的损坏费用
- 全面保障：涵盖非碰撞事件，如盗窃或故意破坏
- 医疗费用保险：事故后支付医疗费用
- 未投保/保险不足司机保障：保护您免受投保不足的司机影响

我们还提供一些可选保障，如租车报销、道路救援和新车更换。 
您想了解这些保障的更多细节，还是有其他关于为您的车辆投保的具体问题？
</example 3>

<example 4>
H: 我想了解一下你们的电动车保险。

A: 当然可以！我们的电动车保险专为电动车车主的独特需求量身定制。 
除了我们为普通车辆提供的所有标准保障外，我们的电动车保险还包括：

- 电池保障：保护您的车辆昂贵电池系统免受损坏或老化
- 技术包：涵盖高级电子设备和车载计算机系统的维修或更换
- 充电站保障：保护家庭和便携式充电设备
- 网络安全保障：对抗黑客攻击或数字威胁的保障
- 专业道路救援：包括平板拖车服务，以保护车辆底盘

我们为多种电动车提供保障，包括特斯拉、Rivian、日产、雪佛兰等热门车型。 
您是否有特定的电动车需要投保，或者您想了解某些保障的更多细节？
</example 4>

<example 5>
H: 我想获取我的汽车保险报价。

A: 当然！我很乐意为您提供汽车保险报价。 
为了为您提供准确的报价，我需要收集一些关于您车辆和主要驾驶人的信息。 
让我们从基本信息开始：

1. 您的车辆品牌和型号是什么？
2. 车辆生产年份是哪一年？
3. 您大约行驶了多少英里？
4. 主要驾驶人的年龄是多少？

一旦您提供了这些信息，我会使用我们的报价工具为您生成个性化的保险报价。
</example 5>
"""

Você também precisará incluir todas as instruções importantes sobre o que fazer e o que não fazer na forma como a Claude interage com os clientes. Essas instruções podem ser retiradas da proteção da marca ou das políticas de suporte.

ADDITIONAL_GUARDRAILS = """请遵循以下防护措施：
1. 仅提供我们产品中列出的保险类型信息。
2. 如果被问及我们不提供的保险类型，请礼貌地说明我们不提供此类服务。
3. 不要对未来的产品或公司计划进行猜测。
4. 不要做出未经授权的承诺或达成协议。你只能提供信息和指导。
5. 不要提及任何竞争对手的产品或服务。
"""

Agora vamos combinar todas essas partes em uma string para usar como prompt.

TASK_SPECIFIC_INSTRUCTIONS = ' '.join([
   STATIC_GREETINGS_AND_GENERAL,
   STATIC_CAR_INSURANCE,
   STATIC_ELECTRIC_CAR_INSURANCE,
   EXAMPLES,
   ADDITIONAL_GUARDRAILS,
])

Uso de ferramentas para fortalecer a dinâmica e a proatividade

O Claude pode executar operações e recuperar informações dinamicamente usando recursos de ferramentas do lado do cliente. Todas as ferramentas externas ou APIs que devem ser usadas para o prompt são listadas primeiro.

Neste exemplo, começaremos com uma ferramenta para calcular cotações.

Observe que a ferramenta não realiza o cálculo de fato, apenas sinaliza para o aplicativo que a ferramenta deve ser usada e passa os parâmetros especificados.

Exemplo de calculadora de cotação de seguro:

TOOLS = [{
  "name": "get_quote",
  "description": "根据用户输入计算保险报价。返回值为每月的保费。",
  "input_schema": {
    "type": "object",
    "properties": {
      "make": {"type": "string", "description": "车辆的品牌。"},
      "model": {"type": "string", "description": "车辆的型号。"},
      "year": {"type": "integer", "description": "车辆的生产年份。"},
      "mileage": {"type": "integer", "description": "车辆的行驶里程数。"},
      "driver_age": {"type": "integer", "description": "主要驾驶员的年龄。"}
    },
    "required": ["make", "model", "year", "mileage", "driver_age"]
  }
}]

def get_quote(make, model, year, mileage, driver_age):
    """返回每月的保费（以美元计）"""
    # 你可以调用 HTTP 端点或数据库来获取报价。
    # 这里，我们模拟1秒的延迟并返回固定的100美元报价。
    time.sleep(1)
    return 100

Implementação de suas dicas

Sem implantar o prompt no ambiente de produção de teste e Avaliação operacional No caso do Anthropic SDK, é difícil saber a eficácia de suas dicas. Portanto, vamos criar um pequeno aplicativo usando nossas dicas, o Anthropic SDK e o streamlit, e criar uma interface de usuário para ele.

com o nome chatbot.py primeiro configure a classe ChatBot, que encapsulará as mesmas informações que são usadas pela classe Antrópica Interações do SDK.

A classe deve conter dois métodos principais:generate_message responder cantando process_user_input.

from anthropic import Anthropic
from config import IDENTITY, TOOLS, MODEL, get_quote
from dotenv import load_dotenv

load_dotenv()

class ChatBot:
   def __init__(self, session_state):
       self.anthropic = Anthropic()
       self.session_state = session_state

   def generate_message(
       self,
       messages,
       max_tokens,
   ):
       try:
           response = self.anthropic.messages.create(
               model=MODEL,
               system=IDENTITY,
               max_tokens=max_tokens,
               messages=messages,
               tools=TOOLS,
           )
           return response
       except Exception as e:
           return {"error": str(e)}

   def process_user_input(self, user_input):
       self.session_state.messages.append({"role": "user", "content": user_input})

       response_message = self.generate_message(
           messages=self.session_state.messages,
           max_tokens=2048,
       )

       if "error" in response_message:
           return f"发生错误: {response_message['error']}"

       if response_message.content[-1].type == "tool_use":
           tool_use = response_message.content[-1]
           func_name = tool_use.name
           func_params = tool_use.input
           tool_use_id = tool_use.id

           result = self.handle_tool_use(func_name, func_params)
           self.session_state.messages.append(
               {"role": "assistant", "content": response_message.content}
           )
           self.session_state.messages.append({
               "role": "user",
               "content": [{
                   "type": "tool_result",
                   "tool_use_id": tool_use_id,
                   "content": f"{result}",
               }],
           })

           follow_up_response = self.generate_message(
               messages=self.session_state.messages,
               max_tokens=2048,
           )

           if "error" in follow_up_response:
               return f"发生错误: {follow_up_response['error']}"

           response_text = follow_up_response.content[0].text
           self.session_state.messages.append(
               {"role": "assistant", "content": response_text}
           )
           return response_text
      
       elif response_message.content[0].type == "text":
           response_text = response_message.content[0].text
           self.session_state.messages.append(
               {"role": "assistant", "content": response_text}
           )
           return response_text
      
       else:
           raise Exception("发生错误: 意外的响应类型")

   def handle_tool_use(self, func_name, func_params):
       if func_name == "get_quote":
           premium = get_quote(**func_params)
           return f"生成的报价: 每月 ${premium:.2f}"
      
       raise Exception("使用了意外的工具")

Criação da interface do usuário

Implemente esse código usando o Streamlit e um teste de método mestre. Esse main() configura uma interface de bate-papo baseada no Streamlit.

Trabalharemos em um arquivo chamado app.py Isso é feito no arquivo

import streamlit as st
from chatbot import ChatBot
from config import TASK_SPECIFIC_INSTRUCTIONS

def main():
   st.title("与 Eva 聊天，Acme 保险公司的助理🤖")

   if "messages" not in st.session_state:
       st.session_state.messages = [
           {'role': "user", "content": TASK_SPECIFIC_INSTRUCTIONS},
           {'role': "assistant", "content": "明白"},
       ]

   chatbot = ChatBot(st.session_state)

   # 显示用户和助理的消息，跳过前两条
   for message in st.session_state.messages[2:]:
       # 忽略工具使用的消息块
       if isinstance(message["content"], str):
           with st.chat_message(message["role"]):
               st.markdown(message["content"])

   if user_msg := st.chat_input("在此输入您的消息..."):
       st.chat_message("user").markdown(user_msg)

       with st.chat_message("assistant"):
           with st.spinner("Eva 正在思考..."):
               response_placeholder = st.empty()
               full_response = chatbot.process_user_input(user_msg)
               response_placeholder.markdown(full_response)

if __name__ == "__main__":
   main()

Use o seguinte comando para executar o programa:

streamlit run app.py

Avalie suas dicas

Muitas vezes, os prompts exigem testes e otimização para estarem prontos para a produção. Para determinar se a sua solução está pronta, você pode avaliar o desempenho do chatbot por meio de um processo sistemático que combine métodos quantitativos e qualitativos. Com base em seus critérios de sucesso definidos, crie umAvaliação empírica sólidapermitirá que você otimize seus prompts.

Console antrópico Agora é fornecida uma ferramenta de avaliação que permite que você teste seus prompts em diferentes cenários.

Melhorar o desempenho

Em cenários complexos, além do padrãoDicas para engenhariaresponder cantandoEstratégia de implementação de grades de proteçãoAlém disso, pode ser útil considerar outras estratégias para melhorar o desempenho. Aqui estão alguns cenários comuns:

Reduzindo a longa latência de contexto com o RAG

Ao lidar com um grande número de contextos estáticos e dinâmicos, a inclusão de todas as informações na sugestão pode resultar em altos custos, tempos de resposta mais lentos e atingir os limites da janela de contexto. Nesse caso, a implementação de técnicas de RAG (Retrieval Augmented Generation) pode melhorar significativamente o desempenho e a eficiência.

Ao usar o Modelo de incorporação do tipo Voyage A conversão de informações em uma representação vetorial cria um sistema mais escalável e responsivo. Essa abordagem permite a recuperação dinâmica de informações relevantes com base na consulta atual, em vez de incluir todos os contextos possíveis em cada dica.

perceber RAG Usado para apoiar o uso de cenários Formulações RAG demonstrou melhorar a precisão, reduzir os tempos de resposta e diminuir os custos de API em sistemas que exigem uma ampla variedade de contextos.

Integração de dados em tempo real por meio do uso de ferramentas

Ao lidar com consultas que exigem informações em tempo real, como saldos de contas ou detalhes de apólices, uma abordagem baseada em RAGs incorporados não é suficiente. Em vez disso, você pode aproveitar o uso de ferramentas para melhorar significativamente a capacidade do seu chatbot de fornecer respostas precisas em tempo real. Por exemplo, você pode usar ferramentas para encontrar informações de clientes, recuperar detalhes de pedidos e cancelar pedidos em nome dos clientes.

Esse método é usado em nosso Uso da ferramenta: Fórmula do agente de atendimento ao cliente delineado em , permitindo que você integre perfeitamente dados em tempo real às respostas do Claude, proporcionando uma experiência mais personalizada e eficiente ao cliente.

Medidas aprimoradas de proteção de entrada e saída

Ao implementar chatbots, especialmente em cenários de atendimento ao cliente, é fundamental proteger-se contra o risco de abuso, consultas fora do escopo e respostas inadequadas. Embora o Claude seja inerentemente resistente a esses cenários, aqui estão as etapas adicionais para fortalecer as proteções do seu chatbot:

Redução de alucinaçõesImplementação de mecanismos de verificação de fatos e citação para garantir que as respostas sejam baseadas nas informações fornecidas.
Verificação cruzada de informações: certifique-se de que a resposta do agente seja consistente com a política da empresa e com os fatos conhecidos.
Evitar compromissos contratuais: Certifique-se de que o agente não faça promessas ou acordos com os quais ele não tenha autoridade para se comprometer.
Mitigação do jailbreakUse métodos como triagem inócua e validação de entrada para evitar que os usuários explorem as vulnerabilidades do modelo para gerar conteúdo inadequado.
Evite mencionar concorrentes: implemente um filtro de menção a concorrentes para manter o foco de sua marca e evitar mencionar produtos ou serviços de qualquer concorrente.
Manter a função do Claude.Estilo contextual: Evita que o Claude mude seu estilo contextual durante interações longas e complexas.
Remover informações de identificação pessoal (PII): a menos que explicitamente solicitado e autorizado, exclua todas as PII das respostas.

Redução do tempo de resposta percebido por meio do processamento de streaming

A implementação do streaming pode aumentar significativamente o envolvimento e a satisfação do usuário ao lidar com respostas potencialmente longas. Nesse caso, os usuários recebem respostas gradualmente, em vez de esperar que toda a resposta seja gerada.

Veja a seguir as etapas para implementar o processamento de fluxo:

fazer uso de API de streaming antrópico Há suporte para respostas de streaming.
Configura o front-end para processar blocos de texto recebidos.
Exibe um bloco de texto para cada chegada, simulando o efeito da entrada em tempo real.
Implemente um mecanismo para salvar respostas completas, permitindo que os usuários visualizem o conteúdo completo quando retornarem após a navegação.

Em alguns casos, o streaming permite o uso de modelos avançados com latências de base mais altas, pois a exibição progressiva atenua os efeitos de tempos de processamento mais longos.

Amplie seu Chatbot

À medida que a complexidade do Chatbot aumenta, a arquitetura do aplicativo pode evoluir com ele. Antes de adicionar mais camadas à arquitetura, considere as seguintes opções mais simples:

Certifique-se de que está aproveitando ao máximo as dicas e otimizando com a engenharia de dicas. Use nosso Guia de engenharia de dicas Escreva as dicas mais eficazes.
Adicionar outras pessoas ao prompt artefato (que pode incluir cadeia de tacos) para ver se a função desejada pode ser alcançada.

Se o seu Chatbot lida com tarefas muito diversas, você pode considerar adicionar um Classificadores de intenção separados para encaminhar a consulta inicial do cliente. Para os aplicativos existentes, isso envolveria a criação de uma árvore de decisão que encaminha as consultas dos clientes por meio de classificadores para diálogos especializados (cada um com suas próprias ferramentas e prompts do sistema). Observe que essa abordagem exige uma chamada adicional para o Claude, o que pode aumentar a latência.

Integração do Claude aos fluxos de trabalho de suporte

Embora nossos exemplos se concentrem em funções Python que podem ser chamadas em um ambiente Streamlit, a implementação do Claude para suporte em tempo real do Chatbot requer um serviço de API.

Você pode fazer isso:

Criação de um wrapper de API: desenvolva um wrapper de API simples para suas funções classificadas. Por exemplo, você pode usar a API Flask ou a API Fast para envolver seu código como um serviço HTTP. Esse serviço HTTP pode receber a entrada do usuário e retornar uma resposta completa do Assistente. Como resultado, o serviço pode ter as seguintes características:
- Eventos enviados pelo servidor (SSE): o SSE permite a transmissão de respostas em tempo real entre o servidor e o cliente. Isso é fundamental para proporcionar uma experiência suave e interativa ao usar o LLM.
- Armazenamento em cache: a implementação do armazenamento em cache pode melhorar significativamente a capacidade de resposta e reduzir as chamadas de API desnecessárias.
- Retenção de contexto: manter o contexto é importante para a continuidade do diálogo à medida que o usuário navega para longe e para trás.
Criação da interface da Web: implemente uma interface de usuário da Web fácil de usar para interagir com agentes orientados pelo Claude.