Guide des cas d'utilisation communs de Claude : Affectation des ordres de travail
Ce guide décrit comment tirer parti des capacités avancées de Claude en matière de compréhension du langage naturel pour catégoriser les demandes d'assistance à la clientèle à grande échelle, en fonction de l'intention du client, de l'urgence, de la priorité, du profil du client et d'autres facteurs.
Définir l'utilisation ou non de Claude pour l'affectation des ordres de travail
Voici quelques mesures clés qui indiquent que vous devriez utiliser des LLM (Large Language Models) comme Claude plutôt que des méthodes traditionnelles d'apprentissage automatique pour les tâches de classification :
Vous disposez d'un nombre limité de données d'entraînement à l'annotation
Le modèle pré-entraîné de Claude permet de réduire considérablement le temps et le coût de préparation des données en classant efficacement les ordres de travail à l'aide de quelques dizaines d'exemples annotés seulement.
Vos catégories de classification peuvent changer ou évoluer au fil du temps
Une fois qu'une méthode traditionnelle d'apprentissage automatique a été établie, la modifier peut être un processus long et gourmand en données. En revanche, lorsque les besoins de vos produits ou de vos clients évoluent, Claude peut facilement s'adapter aux changements de définition des catégories ou à l'apparition de nouvelles catégories, sans devoir procéder à un réétiquetage important des données d'apprentissage.
Vous devez traiter des entrées de textes complexes et non structurés
Les modèles traditionnels d'apprentissage automatique ont souvent du mal à gérer les données non structurées et nécessitent une ingénierie des caractéristiques poussée. La compréhension avancée du langage de Claude permet une classification précise basée sur le contenu et le contexte sans s'appuyer sur des structures ontologiques strictes.
Vos règles de classification sont basées sur une compréhension sémantique
Les méthodes traditionnelles d'apprentissage automatique s'appuient souvent sur des modèles de sacs de mots ou de simples correspondances de motifs. Lorsque les catégories sont définies par des conditions plutôt que par des exemples, Claude excelle dans la compréhension et l'application de ces règles sous-jacentes.
Vous avez besoin d'un raisonnement interprétable pour les décisions catégoriques
De nombreux modèles traditionnels d'apprentissage automatique ne fournissent que peu ou pas d'informations sur le processus de prise de décision. claude peut fournir des explications lisibles par l'homme sur ses décisions de classification, ce qui renforce la confiance dans le système automatisé et permet de l'adapter facilement en cas de besoin.
Vous souhaitez traiter plus efficacement les cas particuliers et les ordres de travail ambigus.
Les systèmes traditionnels d'apprentissage automatique sont généralement peu performants lorsqu'ils traitent des anomalies et des entrées ambiguës, les classant souvent mal ou les assignant à une catégorie "fourre-tout".Les capacités de traitement du langage naturel de Claude lui permettent de mieux interpréter le contexte et les nuances dans les ordres de travail de soutien, réduisant potentiellement le nombre d'ordres de travail mal classés ou non classés qui nécessitent une intervention humaine. Les capacités de traitement du langage naturel de Claude lui permettent de mieux interpréter le contexte et les nuances des ordres de travail de soutien, ce qui peut réduire le nombre d'ordres de travail mal classés ou non classés nécessitant une intervention humaine.
Vous devez fournir une assistance multilingue sans avoir à gérer plusieurs modèles.
Les approches traditionnelles d'apprentissage automatique nécessitent généralement de maintenir des modèles distincts ou d'effectuer des processus de traduction étendus pour chaque langue prise en charge.Les capacités multilingues de Claude permettent de classer les bons de travail dans une variété de langues sans avoir besoin de modèles distincts ou de processus de traduction étendus, ce qui simplifie le soutien à la clientèle à l'échelle mondiale.
Construire et déployer votre modèle Big Language pour prendre en charge les flux de travail
Connaître vos méthodes de soutien actuelles
Avant de se lancer dans l'automatisation, il est essentiel de comprendre votre système de bons de travail existant. Commencez par étudier la manière dont votre équipe d'assistance gère actuellement l'acheminement des ordres de travail.
Les questions suivantes peuvent être envisagées :
- Quels sont les critères utilisés pour déterminer l'ANS/le plan de service applicable ?
- L'acheminement des ordres de travail est-il utilisé pour déterminer à quel niveau de support ou à quel spécialiste produit l'ordre de travail doit être adressé ?
- Existe-t-il des règles ou des flux de travail automatisés déjà en place ? Dans quelles circonstances échouent-ils ?
- Comment sont traités les cas particuliers ou les ordres de travail flous ?
- Comment les équipes classent-elles les ordres de travail par ordre de priorité ?
Plus vous en saurez sur la façon dont les êtres humains réagissent à certaines situations, mieux vous serez en mesure de communiquer avec le Claude Collaborer aux tâches.
Définir les catégories d'intention des utilisateurs
La capacité de Claude à acheminer efficacement les bons de travail dans votre système est directement liée à la clarté des définitions des catégories dans votre système.
Voici quelques exemples de catégories et de sous-catégories d'intentions de l'utilisateur.
Questions techniques
- Problèmes de matériel
- vulnérabilité des logiciels
- problème de compatibilité
- Problèmes de performance
gestion des comptes
- Réinitialiser le mot de passe
- Problèmes d'accès au compte
- Demande de facturation
- Modification de l'abonnement
Informations sur le produit
- Demande de renseignements sur les fonctions
- Problèmes de compatibilité des produits
- Informations sur les prix
- Demandes de disponibilité
Guides d'utilisation
- Guide d'utilisation
- Aide à la fonction
- Recommandations de bonnes pratiques
- Guide de dépannage
renvoyer des informations
- Rapport sur la vulnérabilité
- Demande de fonction
- Commentaires ou suggestions d'ordre général
- se plaindre .
Commande connexe
- Demande de renseignements sur l'état de la commande
- Informations logistiques
- retourner un produit pour un autre article
- Modification de l'ordre
demande de service
- Assistance à l'installation
- demande d'escalade
- Programme de maintenance
- Annulation du service
problème de sécurité
- Demande de renseignements sur la protection des données
- Rapports sur les activités suspectes
- Aide aux dispositifs de sécurité
Conformité et législation
- Questions de conformité réglementaire
- Conditions d'utilisation Demande de renseignements
- Demandes de documents juridiques
Aide d'urgence
- Défaillance des systèmes critiques
- Questions de sécurité en cas d'urgence
- Questions sensibles au facteur temps
Formation et éducation
- Demandes de formation sur les produits
- Recherche de documents
- Informations sur le webinaire ou l'atelier
Intégration et API
- Assistance à l'intégration
- Questions relatives à l'utilisation de l'API
- Vérification de la compatibilité avec les tiers
Outre l'intention de l'utilisateur, le routage et la hiérarchisation des ordres de travail peuvent être influencés par d'autres facteurs tels que l'urgence, le type de client, les accords de niveau de service ou la langue. Veillez à prendre en compte d'autres critères de routage lorsque vous créez un système de routage automatisé.
Établir des critères de réussite
Travaillez avec votre équipe d'assistance pour utiliser des points de référence, des seuils et des objectifs mesurables.Définir des critères de réussite clairs.
Les normes et points de référence suivants sont communs à l'utilisation du modèle de la langue étendue (LLM) pour l'attribution des ordres de travail :
Cohérence de la classification
Cet indicateur évalue la cohérence de la catégorisation par Claude de bons de travail similaires au fil du temps. Ceci est essentiel pour maintenir la fiabilité de l'allocation. En utilisant régulièrement un ensemble standardisé de modèles de test d'entrée, l'objectif est une cohérence de 95% ou mieux.
Vitesse d'adaptation
Cet indicateur mesure la rapidité avec laquelle Claude s'adapte aux nouvelles catégories ou à l'évolution des modèles de bons de travail. Pour ce faire, on introduit de nouveaux types de bons de travail et on mesure le temps qu'il faut au modèle pour atteindre une précision satisfaisante (par exemple, >90%) dans ces nouvelles catégories. L'objectif est de parvenir à une adaptation dans un délai de 50 à 100 échantillons de bons de travail.
traitement multilingue
Cet indicateur évalue la capacité de Claude à attribuer avec précision des ordres de travail multilingues. Mesure la précision de l'affectation dans différentes langues, avec pour objectif de ne pas diminuer la précision de plus de 5-10% dans les langues non dominantes.
Traitement des cas marginaux
Cet indicateur évalue les performances de Claude lors du traitement de bons de travail peu courants ou complexes. Un ensemble de cas limites est créé dans le but d'atteindre une précision d'affectation d'au moins 801 TP3T sur ces entrées complexes.
affaiblissement du biais
Cet indicateur mesure l'équité de l'allocation de Claude entre les différents groupes de clients. Les décisions d'allocation sont régulièrement examinées pour détecter d'éventuels biais, l'objectif étant d'atteindre une précision d'allocation constante (dans la limite de 2-3%) pour l'ensemble des groupes de clients.
Efficacité des signaux
Ce critère évalue la performance de Claude dans des conditions de contexte minimal où un nombre réduit de jetons est requis. Il mesure la précision des affectations lorsque différentes quantités de contexte sont fournies, l'objectif étant d'atteindre une précision de 90% ou plus lorsque seuls le titre de l'ordre de travail et une brève description sont fournis.
Scores d'interprétabilité
Cet indicateur évalue la qualité et la pertinence des explications de Claude sur ses décisions d'allocation. Un évaluateur humain peut noter les explications (par exemple, de 1 à 5) dans le but d'obtenir une note moyenne de 4 ou plus.
Voici quelques critères de réussite communs, que vous utilisiez ou non un grand modèle linguistique :
Précision de la distribution
La précision de l'affectation mesure si un ordre de travail a été correctement affecté à la bonne équipe ou au bon individu dès la première fois. Elle est généralement mesurée en pourcentage du nombre total de bons de travail correctement attribués. Les références du secteur visent généralement un taux de précision de 90-95%, mais cela dépend de la complexité de la structure de soutien.
fente
Cet indicateur mesure la rapidité avec laquelle un ordre de travail est attribué après avoir été soumis. Des délais d'attribution plus courts conduisent généralement à une résolution plus rapide et à une plus grande satisfaction du client. Le temps d'attribution moyen pour les systèmes optimaux est généralement inférieur à 5 minutes, de nombreux systèmes visant une attribution quasi-instantanée (ce qui est possible en utilisant le LLM).
taux de redistribution
Le taux de réaffectation indique la fréquence à laquelle un bon de travail doit être réaffecté après l'affectation initiale. Un taux de réaffectation plus faible indique que l'affectation initiale est plus précise. L'objectif est de maintenir le taux de redistribution en dessous de 101 TP3T, les systèmes les plus performants atteignant 51 TP3T ou moins.
Taux de résolution au premier contact
Cet indicateur mesure le pourcentage de bons de travail qui sont résolus lors de la première interaction avec le client. Des taux de résolution plus élevés indiquent des affectations efficaces et des équipes d'assistance bien préparées. Les références du secteur se situent généralement entre 70 et 751 TP3T, les équipes les plus performantes atteignant des taux de résolution dès la première intervention de 801 TP3T ou plus.
Temps de traitement moyen
Le temps de traitement moyen mesure le temps nécessaire pour résoudre un bon de travail du début à la fin. Une allocation efficace peut réduire ce temps de manière significative. Les points de référence varient en fonction du secteur et de la complexité, mais de nombreuses organisations s'efforcent de maintenir le délai moyen de traitement des questions non urgentes à moins de 24 heures.
Taux de satisfaction de la clientèle
Généralement mesurées par des enquêtes post-interaction, ces évaluations reflètent la satisfaction globale du client à l'égard du processus d'assistance. Une distribution efficace contribue à la satisfaction. L'objectif est d'atteindre un taux de satisfaction de la clientèle (CSAT) de 90% ou plus, les équipes les plus performantes atteignant un taux de satisfaction de 95% ou plus.
taux de promotion
Cet indicateur mesure la fréquence à laquelle les ordres de travail doivent être transmis à un niveau de support supérieur. Un taux d'escalade plus faible indique généralement une affectation initiale plus précise. L'objectif est de maintenir le taux d'escalade en dessous de 201 TP3T, le système optimal atteignant un taux d'escalade de 101 TP3T ou moins.
Productivité des employés
Cet indicateur mesure le nombre de bons de travail qui peuvent être traités efficacement par le personnel d'assistance après la mise en œuvre d'une solution de distribution. L'amélioration de la distribution devrait se traduire par une augmentation de la productivité. Mesurée en suivant le nombre de demandes de travail résolues par employé par jour ou par heure, l'objectif est d'améliorer la productivité de 10-20% après la mise en œuvre d'un nouveau système de distribution.
Taux de triage en libre-service
Cet indicateur mesure le pourcentage de bons de travail potentiels résolus par des options en libre-service avant d'entrer dans le système de distribution. Des taux de triage plus élevés indiquent un triage efficace avant l'affectation. L'objectif est d'atteindre un taux de triage de 20 à 301 TP3T, les équipes les plus performantes atteignant 401 TP3T ou plus.
Coût par ordre de travail
Cette mesure calcule le coût moyen de résolution de chaque bon de travail d'assistance. Une distribution efficace devrait permettre de réduire les coûts au fil du temps. Bien que les références varient considérablement, de nombreuses organisations visent à réduire le coût par bon de travail de 10-151 TP3T après avoir mis en œuvre un système de distribution amélioré.
Choisir le bon modèle Claude
Le choix du modèle dépend du compromis entre le coût, la précision et le temps de réponse.
De nombreux clients trouvent que claude-3-haiku-20240307
Idéal pour gérer le routage des ordres de travail car c'est le modèle le plus rapide et le plus économique de la famille Claude 3, tout en fournissant d'excellents résultats. Si votre problème de classification nécessite une expertise approfondie ou un raisonnement intentionnel complexe par catégorie, vous pouvez choisir le modèle Claude 3. Le plus grand modèle de sonnet.
Construire un conseil puissant
Claude analyse le contenu des bons de travail et les classe dans des catégories prédéfinies en fonction du type de problème, de l'urgence, de l'expertise requise ou d'autres facteurs pertinents.
Écrivons une invite pour la classification des bons de travail. L'invite initiale doit contenir le contenu de la demande de l'utilisateur et renvoyer le processus de raisonnement et l'intention.
Vous pouvez essayer le Console anthropique téléchargement Générateur de conseils Laissez Claude rédiger la première version du message pour vous.
Vous trouverez ci-dessous un exemple de demande de classification de l'acheminement d'un bon de travail :
def classify_support_request(ticket_contents):
# 为分类任务定义提示
classification_prompt = f"""你将作为客户支持工单分类系统。你的任务是分析客户支持请求,并输出每个请求的适当分类意图,同时给出你的推理过程。
这是你需要分类的客户支持请求:
<request>{ticket_contents}</request>
请仔细分析上述请求,以确定客户的核心意图和需求。考虑客户询问的内容和关注点。
首先,在 <reasoning> 标签内写出你对如何分类该请求的推理和分析。
然后,在 <intent> 标签内输出该请求的适当分类标签。有效的意图包括:
<intents>
<intent>支持、反馈、投诉</intent>
<intent>订单追踪</intent>
<intent>退款/换货</intent>
</intents>
一个请求只能有一个适用的意图。只包括最适合该请求的意图。
例如,考虑以下请求:
<request>您好!我在周六安装了高速光纤网络,安装人员 Kevin 的服务非常棒!我在哪里可以提交我的正面评价?谢谢您的帮助!</request>
这是你的输出应该如何格式化的示例(针对上述请求):
<reasoning>用户希望留下正面反馈。</reasoning>
<intent>支持、反馈、投诉</intent>
这里有几个更多的示例:
<examples>
<example 2>
示例 2 输入:
<request>我想写信感谢你们在上周末我父亲的葬礼上对我家人的关怀。你们的员工非常体贴和乐于助人,这让我们肩上的负担减轻了不少。悼念手册非常漂亮。我们永远不会忘记你们对我们的关爱,我们非常感激整个过程的顺利进行。再次感谢你们,Amarantha Hill 代表 Hill 家庭。</request>
示例 2 输出:
<reasoning>用户留下了他们对体验的正面评价。</reasoning>
<intent>支持、反馈、投诉</intent>
</example 2>
<example 3>
...
</example 8>
<example 9>
示例 9 输入:
<request>你们的网站一直弹出广告窗口,挡住了整个屏幕。我花了二十分钟才找到电话投诉的号码。我怎么可能在这些弹出窗口的干扰下访问我的账户信息?你能帮我访问我的账户吗,因为你们的网站有问题?我需要知道在档的地址。</request>
示例 9 输出:
<reasoning>用户请求帮助以访问其网络账户信息。</reasoning>
<intent>支持、反馈、投诉</intent>
</example 9>
请记住,始终在实际意图输出之前包括分类推理。推理应包含在 <reasoning> 标签内,意图应包含在 <intent> 标签内。仅返回推理和意图。
"""
Décortiquons les éléments clés de ce conseil :
- Nous utilisons la chaîne de caractères f de Python pour créer des modèles d'indices qui permettent d'inclure les éléments suivants
ticket_contents
insérer dans<request>
Tagged in. - Nous avons clairement défini le rôle de Claude en tant que système de classification qui analyse soigneusement le contenu des ordres de travail afin de déterminer l'intention et les besoins fondamentaux du client.
- Nous avons donné à Claude des instructions sur le format de sortie correct dans la rubrique
<reasoning>
L'inférence et l'analyse sont fournies dans les balises et, par la suite, dans la section<intent>
Les balises de catégorie appropriées sont affichées à l'intérieur des balises. - Nous avons désigné des catégories d'intention valides : "Soutien, commentaires, plaintes", "Suivi des commandes" et "Remboursements/échanges".
- Certains exemples (c'est-à-dire quelques conseils) sont fournis pour illustrer la manière dont les résultats doivent être formatés, ce qui peut contribuer à améliorer la précision et la cohérence.
Nous voulons que Claude divise la réponse en sections de balises XML distinctes afin que nous puissions extraire le raisonnement et l'intention séparément à l'aide d'expressions régulières. Cela nous permet de créer des étapes ultérieures ciblées dans le flux de travail de l'acheminement du bon de travail, par exemple en utilisant uniquement l'intention pour décider à qui acheminer le bon de travail.
Déployer vos mots-clés
S'il n'est pas déployé dans un environnement de production test et Évaluation opérationnelleIl est donc difficile de connaître l'efficacité de vos indices.
Construisons la structure de déploiement. Commençons par définir une signature de méthode qui enveloppera nos appels à Claude. Nous utiliserons la méthode que nous avons déjà commencé à écrire, qui commence par la signature de méthode ticket_contents
en tant qu'entrée, renvoie maintenant reasoning
répondre en chantant intent
en sortie. Si vous disposez déjà d'une méthode automatisée utilisant l'apprentissage automatique traditionnel, il est recommandé de suivre la signature de cette méthode.
import anthropic
import re
# 创建一个 Anthropic API 客户端实例
client = anthropic.Anthropic()
# 设置默认模型
DEFAULT_MODEL="claude-3-haiku-20240307"
def classify_support_request(ticket_contents):
# 为分类任务定义提示词
classification_prompt = f"""你将作为客户支持工单的分类系统。
...
... 推理结果应包含在 <reasoning> 标签中,意图应包含在 <intent> 标签中。仅返回推理和意图。
"""
# 将提示词发送到 API 以对支持请求进行分类
message = client.messages.create(
model=DEFAULT_MODEL,
max_tokens=500,
temperature=0,
messages=[{"role": "user", "content": classification_prompt}],
stream=False,
)
reasoning_and_intent = message.content[0].text
# 使用 Python 的正则表达式库提取 `reasoning`
reasoning_match = re.search(
r"<reasoning>(.*?)</reasoning>", reasoning_and_intent, re.DOTALL
)
reasoning = reasoning_match.group(1).strip() if reasoning_match else ""
# 同样提取 `intent`
intent_match = re.search(r"<intent>(.*?)</intent>", reasoning_and_intent, re.DOTALL)
intent = intent_match.group(1).strip() if intent_match else ""
return reasoning, intent
Ce code :
- Importer la bibliothèque Anthropic et créer une instance client en utilisant votre clé API.
- Définit un
classify_support_request
qui prend unticket_contents
Chaîne de caractères. - utiliser
classification_prompt
commandant en chef (militaire)ticket_contents
Envoyez-le à Claude pour qu'il le trie. - Renvoie le modèle extrait de la réponse de l'élément
reasoning
répondre en chantantintent
.
Puisque nous devons attendre l'inférence complète et la génération du texte d'intention avant de procéder à l'analyse syntaxique, il sera stream=False
Réglé sur la valeur par défaut.
Évaluez vos conseils
L'utilisation de mots clés nécessite généralement des tests et des optimisations pour atteindre le statut de solution prête à la production. Pour déterminer si votre solution est prête, évaluez ses performances sur la base de critères et de seuils de réussite préalablement définis.
Pour effectuer une évaluation, vous devez disposer de cas de test pour exécuter l'évaluation. Cet article part du principe que vous avezÉlaboration des cas de test.
Construction de la fonction d'évaluation
Les exemples d'évaluation présentés dans ce guide mesurent les performances de Claude en fonction de trois critères clés :
- précision
- Coût par classification
En fonction de ce qui est important pour vous, il peut être nécessaire d'évaluer Claude dans d'autres dimensions.
Pour effectuer l'évaluation, nous devons d'abord modifier le script précédent en ajoutant une fonction qui compare l'intention prédite à l'intention réelle et calcule le pourcentage de prédictions correctes. Nous devons également ajouter des fonctions de calcul des coûts et de mesure du temps.
import anthropic
import re
# 创建 Anthropic API 客户端的实例
client = anthropic.Anthropic()
# 设置默认模型
DEFAULT_MODEL="claude-3-haiku-20240307"
def classify_support_request(request, actual_intent):
# 定义分类任务的提示
classification_prompt = f"""You will be acting as a customer support ticket classification system.
...
...The reasoning should be enclosed in <reasoning> tags and the intent in <intent> tags. Return only the reasoning and the intent.
"""
message = client.messages.create(
model=DEFAULT_MODEL,
max_tokens=500,
temperature=0,
messages=[{"role": "user", "content": classification_prompt}],
)
usage = message.usage # 获取 API 调用的使用统计信息,包括输入和输出 Token 数量。
reasoning_and_intent = message.content[0].text
# 使用 Python 的正则表达式库提取 `reasoning`。
reasoning_match = re.search(
r"<reasoning>(.*?)</reasoning>", reasoning_and_intent, re.DOTALL
)
reasoning = reasoning_match.group(1).strip() if reasoning_match else ""
# 同样,提取 `intent`。
intent_match = re.search(r"<intent>(.*?)</intent>", reasoning_and_intent, re.DOTALL)
intent = intent_match.group(1).strip() if intent_match else ""
# 检查模型的预测是否正确。
correct = actual_intent.strip() == intent.strip()
# 返回推理结果、意图、正确性和使用情况。
return reasoning, intent, correct, usage
Les modifications que nous avons apportées au code sont les suivantes :
- nous le ferons
actual_intent
Ajouter du cas de test auclassify_support_request
et un mécanisme de comparaison a été mis en place pour évaluer si la catégorisation de l'intention de Claude était cohérente avec notre catégorisation de l'intention dorée. - Nous avons extrait les statistiques d'utilisation des appels à l'API afin de calculer les coûts en fonction de l'utilisation des jetons d'entrée et de sortie.
Effectuez votre évaluation
Une évaluation bien développée nécessite des seuils et des repères clairs pour déterminer ce qui constitue un bon résultat. Le script ci-dessus nous fournira des valeurs de temps d'exécution pour la précision, le temps de réponse et le coût par classification, mais nous avons encore besoin de seuils clairement définis. Exemple :
- Précision : 95% (100 tests)
- Coût par classification : Réduction moyenne de 50% (100 tests) par rapport aux méthodes de routage actuelles
La fixation de ces seuils vous permet de juger rapidement et facilement, à grande échelle, de l'approche qui vous convient le mieux et, grâce à des données empiriques impartiales, de déterminer clairement les améliorations à apporter pour mieux répondre à vos besoins.
améliorer les performances
Dans les scénarios complexes, il faut envisager d'aller au-delà de la norme techniques d'ingénierie rapide répondre en chantant stratégies de mise en œuvre des glissières de sécurité des stratégies supplémentaires peuvent s'avérer utiles. Voici quelques scénarios courants :
Dans le cas de plus de 20 catégories d'intention, utiliser la hiérarchie de classification
Plus le nombre de catégories augmente, plus le nombre d'exemples requis augmente, ce qui peut rendre l'invite difficile à manier. Comme alternative, vous pouvez envisager de mettre en œuvre un système de classification hiérarchique en utilisant des classificateurs hybrides.
- Organisez vos intentions dans une structure arborescente de classification.
- Créer une série de classificateurs à chaque niveau de l'arbre, en activant la méthode de routage en cascade.
Par exemple, vous pouvez disposer d'un classificateur de premier niveau qui classe les ordres de travail dans les catégories "problèmes techniques", "problèmes de facturation" et "demandes générales". Chacune de ces catégories peut avoir son propre sous-classeur pour affiner la classification.

- Avantages - Plus de nuances et de précision : Vous pouvez créer des invites différentes pour chaque chemin d'accès, ce qui permet une catégorisation plus ciblée et spécifique au contexte. Cela améliore la précision et permet un traitement plus granulaire des demandes des clients.
- Inconvénients - Augmentation de la latence : Notez que l'utilisation de plusieurs classificateurs peut entraîner une augmentation de la latence, c'est pourquoi nous recommandons de mettre en œuvre cette méthode lors de l'utilisation de notre modèle le plus rapide, Haiku.
Utilisation de bases de données vectorielles et de recherche par similarité pour traiter des ordres de travail très variables
Bien que la fourniture d'exemples soit le moyen le plus efficace d'améliorer les performances, il peut être difficile d'inclure suffisamment d'exemples dans une seule invite si les demandes de soutien sont très variables.
Dans ce cas, vous pouvez utiliser la base de données vectorielle pour effectuer une recherche de similarité à partir de l'ensemble de données d'exemples et récupérer les exemples les plus pertinents pour une requête donnée.
Cette méthodologie est utilisée dans notre recette de classification qui est décrite en détail, a permis d'améliorer les performances en passant d'une précision de 71% à une précision de 93%.
Prise en compte particulière des cas limites anticipés
Voici quelques scénarios dans lesquels Claude pourrait mal classer un ordre de travail (il peut y avoir d'autres situations propres à votre situation). Dans ces scénarios, envisagez de fournir des instructions claires ou des exemples dans les messages-guides sur la façon dont Claude doit traiter les cas limites :
Les clients font des demandes implicites
Les clients expriment souvent leurs besoins de manière indirecte. Par exemple, "J'attends mon colis depuis plus de deux semaines" peut être une demande indirecte d'état de la commande.
- Solution : Fournissez à Claude des exemples concrets de demandes de ce type et de leur intention sous-jacente. Si vous incluez une logique de catégorisation particulièrement nuancée pour l'intention du bon de travail, vous pouvez obtenir de meilleurs résultats afin que Claude soit mieux à même de généraliser la logique à d'autres bons de travail.
Claude privilégie l'émotion à l'intention
Lorsqu'un client exprime son mécontentement, Claude peut donner la priorité à la gestion de l'émotion plutôt qu'à la résolution du problème sous-jacent.
- Solution : Fournir à Claude une indication sur le moment où il doit donner la priorité à l'opinion des clients. Cela pourrait être quelque chose d'aussi simple que "Ignorez tous les sentiments des clients. Concentrez-vous uniquement sur l'analyse de l'intention de la demande du client et sur les informations qu'il peut demander".
La multiplicité des problèmes entraîne une confusion dans l'établissement des priorités
Claude peut avoir des difficultés à identifier les principales préoccupations lorsqu'un client pose plusieurs questions au cours d'une même interaction.
- Solution : Clarifier l'ordre de priorité des intentions afin que Claude puisse mieux hiérarchiser les intentions extraites et identifier les principales préoccupations.
Intégrer Claude dans votre processus d'assistance
Une bonne intégration exige que vous preniez des décisions sur la façon dont les scripts d'acheminement des bons de travail basés sur Claude s'intègrent dans l'architecture plus large du système d'acheminement des bons de travail. Vous pouvez le faire de deux manières :
- Basé sur la poussée : Le système de demande d'assistance que vous utilisez (par exemple Zendesk) déclenche votre code en envoyant un événement webhook à votre service de routage, qui classe et achemine l'intention.
- Cette approche est plus évolutive sur le plan du réseau, mais nécessite l'exposition d'un point d'extrémité.
- Basé sur la traction : Votre code extrait le dernier bon de travail en fonction du calendrier donné et l'achemine au fur et à mesure qu'il est extrait.
- Cette approche est plus facile à mettre en œuvre, mais elle peut entraîner des appels inutiles au système de bons de travail s'il est utilisé trop fréquemment, ou être trop lente s'il est utilisé trop rarement.
Pour les deux méthodes, vous devez intégrer vos scripts dans un service. La méthode que vous choisissez dépend des API fournies par votre système de bons de travail.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...