Claude Guía de casos de uso común: Asignación de órdenes de trabajo

Tutoriales prácticos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

Esta guía describe cómo aprovechar las funciones avanzadas de comprensión del lenguaje natural de Claude para clasificar las órdenes de trabajo de atención al cliente a escala, en función de la intención del cliente, la urgencia, la prioridad, el perfil del cliente y otros factores.

Definir si se utiliza o no Claude para la asignación de órdenes de trabajo.

He aquí algunas métricas clave que indican que debería utilizar LLM (Large Language Models) como Claude en lugar de métodos tradicionales de aprendizaje automático para tareas de clasificación:

Dispone de pocos datos de entrenamiento de anotación

Los procesos tradicionales de aprendizaje automático requieren grandes conjuntos de datos anotados. El modelo preentrenado de Claude puede reducir significativamente el tiempo y el coste de la preparación de datos al clasificar eficazmente las órdenes de trabajo utilizando sólo unas pocas docenas de ejemplos anotados.

Sus categorías de clasificación pueden cambiar o evolucionar con el tiempo

Una vez que se ha establecido un método tradicional de aprendizaje automático, modificarlo puede ser un proceso largo y con muchos datos. En cambio, a medida que cambian las necesidades de sus productos o clientes, Claude puede adaptarse fácilmente a los cambios en las definiciones de las categorías o a nuevas categorías sin necesidad de reetiquetar exhaustivamente los datos de entrenamiento.

Necesita manejar entradas de texto complejas no estructuradas

Los modelos tradicionales de aprendizaje automático suelen tener dificultades con los datos no estructurados y requieren una ingeniería de características exhaustiva.La comprensión avanzada del lenguaje de Claude permite una clasificación precisa basada en el contenido y el contexto sin depender de estructuras ontológicas estrictas.

Sus reglas de clasificación se basan en la comprensión semántica

Los métodos tradicionales de aprendizaje automático suelen basarse en modelos de bolsa de palabras o en la simple coincidencia de patrones. Cuando las categorías se definen por condiciones y no por ejemplos, Claude destaca en la comprensión y aplicación de estas reglas subyacentes.

Se necesitan razonamientos interpretables para las decisiones categóricas

Muchos modelos tradicionales de aprendizaje automático ofrecen poca o ninguna información sobre el proceso de toma de decisiones. claude puede ofrecer explicaciones legibles para el ser humano sobre sus decisiones de clasificación, lo que aumenta la confianza en el sistema automatizado y facilita su adaptación cuando es necesario.

Desea gestionar más eficazmente los casos extremos y las órdenes de trabajo ambiguas.

Los sistemas tradicionales de aprendizaje automático no suelen funcionar bien cuando tratan anomalías y entradas ambiguas, y a menudo las clasifican erróneamente o las asignan a una categoría "comodín".Las capacidades de procesamiento del lenguaje natural de Claude le permiten interpretar mejor el contexto y los matices de las órdenes de trabajo de asistencia, lo que puede reducir el número de órdenes de trabajo mal clasificadas o sin clasificar que requieren intervención humana. Es posible reducir el número de órdenes de trabajo mal clasificadas o sin clasificar que requieren intervención manual.

Necesita ofrecer asistencia multilingüe sin mantener varios modelos

Los enfoques tradicionales de aprendizaje automático suelen requerir el mantenimiento de modelos separados o la realización de extensos procesos de traducción para cada idioma admitido.Las capacidades multilingües de Claude permiten clasificar las órdenes de trabajo en una variedad de idiomas sin necesidad de modelos separados ni de extensos procesos de traducción, lo que simplifica la atención global al cliente.

Cree e implante su modelo de Big Language para dar soporte a los flujos de trabajo

Conozca sus métodos de apoyo actuales

Antes de lanzarse a la automatización, es fundamental conocer su sistema actual de órdenes de trabajo. Empiece por investigar cómo gestiona actualmente su equipo de asistencia el enrutamiento de las órdenes de trabajo.

Pueden plantearse las siguientes cuestiones:

¿Qué criterios se han utilizado para determinar el SLA/plan de servicio aplicable?
¿Se utiliza el enrutamiento de órdenes de trabajo para determinar a qué nivel de soporte o especialista de producto debe dirigirse la orden de trabajo?
¿Existen ya reglas o flujos de trabajo automatizados? ¿En qué circunstancias fallan?
¿Cómo se gestionan los casos extremos o las órdenes de trabajo difusas?
¿Cómo priorizan los equipos las órdenes de trabajo?

Cuanto más sepa sobre cómo afrontan los seres humanos determinadas situaciones, mejor podrá comunicarse con los Claude Colabora en las tareas.

Definir las categorías de intención del usuario

Una lista bien definida de categorías de intención del usuario es fundamental para categorizar con precisión las órdenes de trabajo de soporte utilizando Claude.La capacidad de Claude para enrutar eficazmente las órdenes de trabajo dentro de su sistema está directamente relacionada con la claridad de las definiciones de categorías en su sistema.

A continuación se muestran algunos ejemplos de categorías y subcategorías de intención de usuario.

Cuestiones técnicas

Problemas de hardware
vulnerabilidad del software
problema de compatibilidad
Problemas de rendimiento

gestión de cuentas

Restablecer contraseña
Problemas de acceso a la cuenta
Consulta sobre facturación
Cambio de suscripción

Información sobre el producto

Consulta de funciones
Problemas de compatibilidad de productos
Información sobre precios
Consultas de disponibilidad

Guías del usuario

Guía de funcionamiento
Función Ayuda
Recomendaciones de buenas prácticas
Guía de resolución de problemas

devolver información

Informes sobre vulnerabilidades
Solicitud de función
Comentarios o sugerencias generales
quejarse .

Pedidos relacionados

Consulta sobre el estado del pedido
Información logística
devolver un producto por otro
Modificación de la orden

solicitud de servicio

Asistencia a la instalación
solicitud de escalada
Programa de mantenimiento
Anulación del servicio

problema de seguridad

Consulta sobre protección de datos
Informes de actividades sospechosas
Funciones de seguridad Ayuda

Cumplimiento y aspectos jurídicos

Cumplimiento de la normativa
Consulta sobre las condiciones de servicio
Solicitud de documentos jurídicos

Ayuda de emergencia

Fallo de sistemas críticos
Cuestiones de seguridad en caso de emergencia
Cuestiones sensibles al tiempo

Formación y educación

Solicitudes de formación sobre productos
Búsqueda de documentos
Información sobre seminarios web o talleres

Integración y API

Ayuda a la integración
Problemas de uso de la API
Comprobación de compatibilidad con terceros

Además de la intención del usuario, el enrutamiento y la priorización de las órdenes de trabajo pueden verse influidos por otros factores como la urgencia, el tipo de cliente, los SLA o el idioma. Asegúrate de tener en cuenta otros criterios de enrutamiento al crear un sistema de enrutamiento automatizado.

Establecer criterios de éxito

Trabaje con su equipo de asistencia para utilizar puntos de referencia, umbrales y objetivos mensurables.Definir criterios de éxito claros.

Las siguientes son normas y puntos de referencia comunes cuando se utiliza el Modelo de Lenguaje Grande (LLM) para la asignación de órdenes de trabajo:

Coherencia de la clasificación

Esta métrica evalúa la coherencia de la categorización de Claude de órdenes de trabajo similares a lo largo del tiempo. Esto es fundamental para mantener la fiabilidad de la asignación. Mediante el uso periódico de un conjunto normalizado de modelos de prueba de entrada, el objetivo es lograr una coherencia de 95% o superior.

Velocidad de adaptación

Esta métrica mide la rapidez con la que Claude se adapta a nuevas categorías o a patrones cambiantes de órdenes de trabajo. Para ello, se introducen nuevos tipos de órdenes de trabajo y se mide el tiempo que tarda el modelo en alcanzar una precisión satisfactoria (por ejemplo, >90%) en estas nuevas categorías. El objetivo es lograr la adaptación en 50-100 órdenes de trabajo de muestra.

tratamiento multilingüe

Esta métrica evalúa la capacidad de Claude para asignar con precisión órdenes de trabajo multilingües. Mide la precisión de la asignación en distintos idiomas, con el objetivo de que la precisión no baje más de 5-10% en los idiomas no dominantes.

Tratamiento de casos extremos

Esta métrica evalúa el rendimiento de Claude al procesar órdenes de trabajo poco comunes o complejas. Se crea un conjunto de casos límite con el objetivo de lograr una precisión de asignación de al menos 801 TP3T en estas entradas complejas.

debilitamiento del sesgo

Este parámetro mide la equidad de la asignación de Claude a los distintos grupos de clientes. Las decisiones de asignación se revisan periódicamente para detectar posibles sesgos, con el objetivo de lograr una precisión de asignación coherente (dentro de 2-3%) en todos los grupos de clientes.

Eficacia del taco

Este criterio evalúa el rendimiento de Claude en condiciones de contexto mínimo en las que se requiere un número reducido de fichas. Mide la precisión de las asignaciones cuando se proporcionan diferentes cantidades de contexto, con el objetivo de alcanzar una precisión de 90% o superior cuando sólo se proporcionan el título de la orden de trabajo y una breve descripción.

Puntuaciones de interpretabilidad

Este indicador evalúa la calidad y pertinencia de las explicaciones de Claude sobre sus decisiones de asignación. Un evaluador humano puede puntuar las explicaciones (por ejemplo, de 1 a 5) con el objetivo de lograr una puntuación media de 4 o superior.

He aquí algunos criterios de éxito que son comunes tanto si se utiliza un gran modelo lingüístico como si no:

Precisión de la distribución

La precisión de la asignación mide si una orden de trabajo se asignó correctamente al equipo o individuo adecuado la primera vez. Suele medirse como porcentaje del total de órdenes de trabajo asignadas correctamente. Las referencias del sector suelen apuntar a un índice de precisión de 90-95%, pero esto depende de la complejidad de la estructura de soporte.

ranura

Esta métrica hace un seguimiento de la rapidez con la que se asigna una orden de trabajo tras su envío. Un tiempo de asignación más rápido suele conllevar una resolución más rápida y una mayor satisfacción del cliente. El tiempo medio de asignación para sistemas óptimos suele ser inferior a 5 minutos, y muchos sistemas aspiran a una asignación casi instantánea (lo que es posible cuando se utiliza LLM).

índice de redistribución

El índice de reasignación indica la frecuencia con la que es necesario reasignar una orden de trabajo tras la asignación inicial. Un índice de reasignación más bajo indica una asignación inicial más precisa. El objetivo es mantener el índice de redistribución por debajo de 101 TP3T, y los sistemas con mejores resultados logran 51 TP3T o menos.

Tasa de resolución en el primer contacto

Esta métrica mide el porcentaje de órdenes de trabajo que se resuelven en la primera interacción con el cliente. Unas tasas más altas de resolución a la primera indican asignaciones eficientes y equipos de asistencia bien preparados. Los valores de referencia del sector suelen estar entre 70 y 751 TP3T, mientras que los equipos con mejores resultados alcanzan tasas de resolución a la primera de 801 TP3T o más.

Tiempo medio de procesamiento

El tiempo medio de procesamiento mide el tiempo que se tarda en resolver una orden de trabajo de principio a fin. Una asignación eficaz puede reducir significativamente este tiempo. Los puntos de referencia varían según el sector y la complejidad, pero muchas organizaciones aspiran a que el tiempo medio de tramitación de los problemas no urgentes sea inferior a 24 horas.

Valoración de la satisfacción del cliente

Estas valoraciones, que suelen medirse mediante encuestas posteriores a la interacción, reflejan la satisfacción general del cliente con el proceso de asistencia. Una distribución eficaz contribuye a la satisfacción. El objetivo es lograr un índice de satisfacción del cliente (CSAT) de 90% o superior, y que los equipos con mejores resultados alcancen un índice de satisfacción de 95% o superior.

índice de promoción

Este indicador mide la frecuencia con la que las órdenes de trabajo necesitan ser escaladas a un nivel de soporte superior. Un índice de escalado más bajo suele indicar una asignación inicial más precisa. El objetivo es mantener el índice de escalado por debajo de 201 TP3T, con un sistema óptimo que alcance un índice de escalado de 101 TP3T o menos.

Productividad de los empleados

Esta métrica mide el número de órdenes de trabajo que el personal de asistencia puede procesar eficazmente tras la implantación de una solución de distribución. La mejora de la distribución debería traducirse en un aumento de la productividad. Medido mediante el seguimiento del número de órdenes de trabajo resueltas por empleado y día u hora, el objetivo es mejorar la productividad en 10-20% tras implantar un nuevo sistema de distribución.

Tasa de triaje en autoservicio

Esta métrica mide el porcentaje de órdenes de trabajo potenciales resueltas mediante opciones de autoservicio antes de entrar en el sistema de distribución. Los índices de triaje más elevados indican un triaje previo a la asignación eficaz. El objetivo es alcanzar una tasa de triaje de 20-301 TP3T, y los equipos con mejores resultados alcanzarán 401 TP3T o más.

Coste por orden de trabajo

Esta métrica calcula el coste medio de resolución de cada orden de trabajo de asistencia. Una distribución eficiente debería ayudar a reducir los costes a lo largo del tiempo. Aunque los puntos de referencia varían mucho, muchas organizaciones aspiran a reducir el coste por orden de trabajo en 10-151 TP3T tras implantar un sistema de distribución mejorado.

Seleccionar el modelo Claude adecuado

La elección del modelo depende del equilibrio entre coste, precisión y tiempo de respuesta.

Muchos clientes encuentran claude-3-haiku-20240307 Ideal para gestionar el enrutamiento de órdenes de trabajo, ya que es el modelo más rápido y rentable de la familia Claude 3, sin dejar de ofrecer excelentes resultados. Si su problema de clasificación requiere una gran experiencia o un razonamiento de categorías intencional muy complejo, puede elegir el modelo El modelo Bigger Sonnet.

Construir un consejo poderoso

Claude analiza el contenido de las órdenes de trabajo de asistencia y las clasifica en categorías predefinidas en función del tipo de problema, la urgencia, la experiencia necesaria u otros factores relevantes.

Escribamos un prompt para la clasificación de órdenes de trabajo. El prompt inicial debe contener el contenido de la solicitud del usuario y devolver el proceso de razonamiento y la intención.

Puede probar el Consola antrópica cargar Generador de consejos Deja que Claude te escriba la primera versión del mensaje.

A continuación se muestra un ejemplo de solicitud de clasificación de enrutamiento de órdenes de trabajo:

def classify_support_request(ticket_contents):
    # 为分类任务定义提示
    classification_prompt = f"""你将作为客户支持工单分类系统。你的任务是分析客户支持请求，并输出每个请求的适当分类意图，同时给出你的推理过程。

        这是你需要分类的客户支持请求：

        <request>{ticket_contents}</request>

        请仔细分析上述请求，以确定客户的核心意图和需求。考虑客户询问的内容和关注点。

        首先，在 <reasoning> 标签内写出你对如何分类该请求的推理和分析。

        然后，在 <intent> 标签内输出该请求的适当分类标签。有效的意图包括：
        <intents>
        <intent>支持、反馈、投诉</intent>
        <intent>订单追踪</intent>
        <intent>退款/换货</intent>
        </intents>

        一个请求只能有一个适用的意图。只包括最适合该请求的意图。

        例如，考虑以下请求：
        <request>您好！我在周六安装了高速光纤网络，安装人员 Kevin 的服务非常棒！我在哪里可以提交我的正面评价？谢谢您的帮助！</request>

        这是你的输出应该如何格式化的示例（针对上述请求）：
        <reasoning>用户希望留下正面反馈。</reasoning>
        <intent>支持、反馈、投诉</intent>

        这里有几个更多的示例：
        <examples>
        <example 2>
        示例 2 输入：
        <request>我想写信感谢你们在上周末我父亲的葬礼上对我家人的关怀。你们的员工非常体贴和乐于助人，这让我们肩上的负担减轻了不少。悼念手册非常漂亮。我们永远不会忘记你们对我们的关爱，我们非常感激整个过程的顺利进行。再次感谢你们，Amarantha Hill 代表 Hill 家庭。</request>

        示例 2 输出：
        <reasoning>用户留下了他们对体验的正面评价。</reasoning>
        <intent>支持、反馈、投诉</intent>
        </example 2>
        <example 3>

        ...

        </example 8>
        <example 9>
        示例 9 输入：
        <request>你们的网站一直弹出广告窗口，挡住了整个屏幕。我花了二十分钟才找到电话投诉的号码。我怎么可能在这些弹出窗口的干扰下访问我的账户信息？你能帮我访问我的账户吗，因为你们的网站有问题？我需要知道在档的地址。</request>

        示例 9 输出：
        <reasoning>用户请求帮助以访问其网络账户信息。</reasoning>
        <intent>支持、反馈、投诉</intent>
        </example 9>

        请记住，始终在实际意图输出之前包括分类推理。推理应包含在 <reasoning> 标签内，意图应包含在 <intent> 标签内。仅返回推理和意图。
        """

Desglosemos las partes clave de ese consejo:

Usamos f-string de Python para crear plantillas de sugerencias que permiten la inclusión de ticket_contents insertar en <request> Etiquetado en.
Definimos claramente el papel de Claude como sistema de clasificación que analiza minuciosamente el contenido de las órdenes de trabajo para determinar la intención central y las necesidades del cliente.
Hemos dado instrucciones a Claude sobre el formato de salida correcto en el <reasoning> La inferencia y el análisis se proporcionan dentro de las etiquetas y posteriormente en el <intent> Imprime las etiquetas de categoría adecuadas dentro de las etiquetas.
Hemos designado categorías de intención válidas: "Asistencia, comentarios, quejas", "Seguimiento de pedidos" y "Reembolsos/cambios".
Se ofrecen algunos ejemplos para ilustrar cómo debe formatearse la salida, lo que puede ayudar a mejorar la precisión y la coherencia.

Queremos que Claude divida la respuesta en secciones de etiquetas XML separadas para que podamos extraer el razonamiento y la intención por separado utilizando expresiones regulares. Esto nos permite crear pasos posteriores específicos en el flujo de trabajo de enrutamiento de la orden de trabajo, por ejemplo, utilizando sólo la intención para decidir a quién enrutar la orden de trabajo.

Despliegue de las palabras clave

Si no se implanta en un entorno de producción de prueba y Evaluación operativaes difícil saber hasta qué punto son efectivas tus palabras clave.

Construyamos la estructura de despliegue. Empecemos por definir una firma de método que envolverá nuestras llamadas a Claude. Utilizaremos el método que ya hemos empezado a escribir, que empieza con el carácter ticket_contents como entrada, ahora devuelve reasoning responder cantando intent como salida. Si ya dispone de un método automatizado que utilice el aprendizaje automático tradicional, se recomienda seguir la firma de dicho método.

import anthropic
import re

# 创建一个 Anthropic API 客户端实例
client = anthropic.Anthropic()

# 设置默认模型
DEFAULT_MODEL="claude-3-haiku-20240307"

def classify_support_request(ticket_contents):
    # 为分类任务定义提示词
    classification_prompt = f"""你将作为客户支持工单的分类系统。
        ...
        ... 推理结果应包含在 <reasoning> 标签中，意图应包含在 <intent> 标签中。仅返回推理和意图。
        """
    # 将提示词发送到 API 以对支持请求进行分类
    message = client.messages.create(
        model=DEFAULT_MODEL,
        max_tokens=500,
        temperature=0,
        messages=[{"role": "user", "content": classification_prompt}],
        stream=False,
    )
    reasoning_and_intent = message.content[0].text

    # 使用 Python 的正则表达式库提取 `reasoning`
    reasoning_match = re.search(
        r"<reasoning>(.*?)</reasoning>", reasoning_and_intent, re.DOTALL
    )
    reasoning = reasoning_match.group(1).strip() if reasoning_match else ""

    # 同样提取 `intent`
    intent_match = re.search(r"<intent>(.*?)</intent>", reasoning_and_intent, re.DOTALL)
    intent = intent_match.group(1).strip() if intent_match else ""

    return reasoning, intent

Este código:

Importa la biblioteca Anthropic y crea una instancia cliente utilizando tu clave API.
Define un classify_support_request que toma un ticket_contents Cuerda.
utilizar classification_prompt comandante en jefe (militar) ticket_contents Envíaselo a Claude para que lo clasifique.
Devuelve el modelo extraído de la respuesta del reasoning responder cantando intent.

Dado que tenemos que esperar a la inferencia completa y a la generación del texto de intención antes del análisis sintáctico, vamos a stream=False Establece el valor por defecto.

Evalúe sus consejos

El uso de palabras clave suele requerir pruebas y optimización para alcanzar el estado de listo para la producción. Para determinar si su solución está lista, evalúe su rendimiento en función de criterios de éxito y umbrales previamente establecidos.

Para ejecutar una evaluación, necesita tener casos de prueba para ejecutar la evaluación. Este artículo asume que usted tieneDesarrollo de sus casos de prueba.

Construcción de la función de evaluación

Los ejemplos de evaluación de esta guía miden el rendimiento de Claude en función de tres parámetros clave:

precisión
Coste por clasificación

Dependiendo de lo que sea importante para usted, puede ser necesario evaluar a Claude en otras dimensiones.

Para realizar la evaluación, primero tenemos que modificar el script anterior añadiendo una función que compare la intención predicha con la intención real y calcule el porcentaje de predicciones correctas. También tenemos que añadir funciones de cálculo de costes y de medición del tiempo.

import anthropic
import re

# 创建 Anthropic API 客户端的实例
client = anthropic.Anthropic()

# 设置默认模型
DEFAULT_MODEL="claude-3-haiku-20240307"

def classify_support_request(request, actual_intent):
    # 定义分类任务的提示
    classification_prompt = f"""You will be acting as a customer support ticket classification system. 
        ...
        ...The reasoning should be enclosed in <reasoning> tags and the intent in <intent> tags. Return only the reasoning and the intent.
        """

    message = client.messages.create(
        model=DEFAULT_MODEL,
        max_tokens=500,
        temperature=0,
        messages=[{"role": "user", "content": classification_prompt}],
    )
    usage = message.usage  # 获取 API 调用的使用统计信息，包括输入和输出 Token 数量。
    reasoning_and_intent = message.content[0].text

    # 使用 Python 的正则表达式库提取 `reasoning`。
    reasoning_match = re.search(
        r"<reasoning>(.*?)</reasoning>", reasoning_and_intent, re.DOTALL
    )
    reasoning = reasoning_match.group(1).strip() if reasoning_match else ""

    # 同样，提取 `intent`。
    intent_match = re.search(r"<intent>(.*?)</intent>", reasoning_and_intent, re.DOTALL)
    intent = intent_match.group(1).strip() if intent_match else ""

    # 检查模型的预测是否正确。
    correct = actual_intent.strip() == intent.strip()

    # 返回推理结果、意图、正确性和使用情况。
    return reasoning, intent, correct, usage

Los cambios que hemos introducido en el código son los siguientes:

lo haremos actual_intent Añadir del caso de prueba al classify_support_request y se estableció un mecanismo de comparación para evaluar si la categorización de intenciones de Claude era coherente con nuestra categorización de intenciones áureas.
Extrajimos estadísticas de uso de las llamadas a la API para calcular los costes basados en el uso de tokens de entrada y salida.

Realice su evaluación

Una evaluación bien desarrollada requiere umbrales y puntos de referencia claros para determinar qué constituye un buen resultado. El script anterior nos proporcionará valores de tiempo de ejecución para la precisión, el tiempo de respuesta y el coste por clasificación, pero seguimos necesitando umbrales claramente establecidos. Ejemplo:

Precisión: 95% (100 pruebas)
Coste por clasificación: Reducción media de 50% (100 pruebas) en comparación con los métodos de enrutamiento actuales.

Establecer estos umbrales le permite juzgar rápida y fácilmente a escala qué enfoque es el mejor para usted y, con datos empíricos imparciales, dejar claro qué mejoras deben introducirse para satisfacer mejor sus requisitos.

mejorar el rendimiento

En situaciones complejas, considere la posibilidad de ir más allá de la norma técnicas de ingeniería rápida responder cantando estrategias de aplicación de los quitamiedos de estrategias adicionales pueden ser útiles. He aquí algunas situaciones habituales:

Para el caso de más de 20 categorías de intenciones, utilice la jerarquía de categorización

A medida que aumenta el número de categorías, también lo hace el número de ejemplos necesarios, lo que puede hacer que la consulta resulte difícil de manejar. Como alternativa, puede considerar implementar un sistema de clasificación jerárquica utilizando clasificadores híbridos.

Organice sus intenciones en una estructura de árbol de clasificación.
Crear una serie de clasificadores en cada nivel del árbol, habilitando el método de enrutamiento en cascada.

Por ejemplo, puede tener un clasificador de nivel superior que clasifique a grandes rasgos las órdenes de trabajo en "Problemas técnicos", "Problemas de facturación" y "Consultas generales". Cada una de estas categorías puede tener su propio subclasificador para refinar aún más la clasificación.

Ventajas - Mayor matiz y precisión: Puede crear diferentes avisos para cada ruta principal, lo que permite una categorización más específica y adaptada al contexto. Esto mejora la precisión y permite una gestión más detallada de las solicitudes de los clientes.
Desventajas - Mayor latencia: Tenga en cuenta que varios clasificadores pueden provocar un aumento de la latencia, por lo que recomendamos aplicar este método cuando utilice nuestro modelo más rápido, Haiku.

Uso de bases de datos vectoriales y recuperación por búsqueda de similitudes para gestionar órdenes de trabajo muy variables.

Aunque ofrecer ejemplos es la forma más eficaz de mejorar el rendimiento, puede resultar difícil incluir suficientes ejemplos en un solo aviso si las solicitudes de asistencia son muy variables.

En este caso, puede utilizar la base de datos vectorial para realizar una búsqueda de similitudes a partir del conjunto de datos de ejemplos y recuperar los ejemplos más relevantes para una consulta determinada.

Esta metodología se utiliza en nuestro receta de clasificación que se describe en detalle, se ha demostrado que mejora el rendimiento de 71% de precisión a 93% de precisión.

Consideración especial de los casos extremos previstos

A continuación se presentan algunos escenarios en los que Claude podría clasificar erróneamente una orden de trabajo (puede haber otras situaciones que sean exclusivas de su situación). En estos casos, considere la posibilidad de proporcionar instrucciones claras o ejemplos en las instrucciones sobre cómo Claude debe manejar los casos extremos:

Los clientes hacen peticiones implícitas

A menudo, los clientes expresan sus necesidades de forma indirecta. Por ejemplo, "Llevo más de dos semanas esperando mi paquete" puede ser una petición indirecta sobre el estado del pedido.

Solución: Proporcione a Claude algunos ejemplos de clientes reales de este tipo de solicitudes y su intención subyacente. Si incluye un razonamiento de categorización especialmente matizado para la intención de la orden de trabajo, puede obtener mejores resultados para que Claude pueda generalizar mejor la lógica a otras órdenes de trabajo.

Claude da prioridad a la emoción sobre la intención

Cuando un cliente expresa su insatisfacción, Claude puede dar prioridad a tratar la emoción en lugar de resolver el problema subyacente.

Solución: Indique a Claude cuándo debe dar prioridad a las opiniones de los clientes. Podría ser algo tan sencillo como "Ignora todos los sentimientos del cliente. Céntrate sólo en analizar la intención de la solicitud del cliente y la información que éste pueda estar pidiendo."

La multiplicidad de problemas genera confusión a la hora de priorizarlos

Claude puede tener dificultades para identificar las principales preocupaciones cuando un cliente hace varias preguntas en una interacción.

Solución: Aclarar la priorización de intenciones para que Claude pueda priorizar mejor las intenciones extraídas e identificar las preocupaciones clave.

Integración de Claude en un flujo de trabajo de asistencia más amplio

Una integración adecuada requiere que tome algunas decisiones sobre cómo encajan los scripts de enrutamiento de órdenes de trabajo basados en Claude en la arquitectura más amplia del sistema de enrutamiento de órdenes de trabajo. Puede hacerlo de dos maneras:

A base de empujones: El sistema de órdenes de trabajo de soporte que utiliza (por ejemplo, Zendesk) activa su código enviando un evento webhook a su servicio de enrutamiento, que luego clasifica y enruta la intención.
- Este enfoque es más escalable en red, pero requiere exponer un punto final.
Basado en el tirón: Su código extrae la última orden de trabajo basada en la programación dada y la encamina a medida que se extrae.
- Este enfoque es más fácil de implementar, pero puede hacer llamadas innecesarias al sistema de órdenes de trabajo de apoyo si se extrae con demasiada frecuencia, o puede ser demasiado lento si se extrae con muy poca frecuencia.

Para ambos métodos, necesita envolver sus scripts en un servicio. El método que elija dependerá de las API que ofrezca su sistema de órdenes de trabajo de asistencia.