La notation positive et multidimensionnelle des deux réponses facilite le choix de la meilleure réponse.

LangChain Hub #1 tipster en chinois. Publié il y a plus d'un an et utilisé dans l'évaluation globale des scores combinés des différentes stratégies RAG. Traduit et adapté pour être utilisé dans plusieurs langues.

 

Utiliser l'aide

Évaluer quelle réponse est la meilleure, en supposant que les deux réponses sont correctes. Évaluer quelles réponses sont "susceptibles" de poser problème si la différence dans le score composite est supérieure à 1. Pour les réponses qui ont une forte probabilité d'être correctes, il est prudent d'écraser la base de connaissances.

Domaines d'application :

  1. Utilisé pour évaluer les différents "indices de paires d'AQ extraites" et déterminer l'indice le plus approprié.
  2. Permet d'évaluer si les réponses des élèves (nouvelle stratégie RAG) sont meilleures lorsque la réponse de référence est utilisée comme réponse standard de base.

Une meilleure définition est sujette aux idées fausses suivantes : les réponses sont absolument correctes, riches en détails, succinctes et constituent un processus de pensée complet.

 

Commandes en chinois

你对学生提问,学生给出了答案,你要对参考答案和学生答案分别评分。
您必须根据相关度、完整度、语义清晰度和歧义度分别对两个答案进行评分。
最后给两个答案进行综合评分。
\n\n
提问:
"""
{question}
"""
\n\n
请对以下答案给出数字1~100之间评分:
\n\n
参考答案:
"""
{reference_answer}
"""
\n
学生答案:
"""
{student_answer}
"""
\n\n
为每个值赋予1~100之间评分,以JSON格式回复,不要其他解释:
```json
"参考答案": 
"相关度": 
"完整度": 
"语义清晰度": 
"歧义度: 
"综合评分":

"学生答案": 
"相关度": 
"完整度": 
"语义清晰度": 
"歧义度": 
"综合评分": 
```
© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...