AI Personal Learning
und praktische Anleitung
Sitzsack Marscode1

Die positive mehrdimensionale Bewertung beider Antworten erleichtert die Beurteilung der besten Antwort.

LangChain Hub #1 Tippgeber auf Chinesisch. Vor über einem Jahr veröffentlicht und für die Gesamtbewertung der kombinierten Ergebnisse verschiedener RAG-Strategien verwendet. Übersetzt und angepasst für die Verwendung in mehreren Sprachen.

 


Hilfe verwenden

Bewerten Sie, welche Antwort besser ist, vorausgesetzt, beide Antworten sind richtig. Beurteilen Sie, welche Antworten "wahrscheinlich" problematisch sind, wenn der Unterschied in der Gesamtpunktzahl größer als 1 ist. Bei Antworten, die mit hoher Wahrscheinlichkeit richtig sind, ist es sicher, die Wissensbasis zu überschreiben.

Anwendungsbereiche:

  1. Wird verwendet, um verschiedene "extrahierte QA-Paar-Stichwörter" zu bewerten und festzustellen, welches Stichwort besser ist.
  2. Wird verwendet, um zu beurteilen, ob die Antworten der Schüler (neue RAG-Strategie) besser sind, wenn die Referenzantwort als Basisstandardantwort verwendet wird

Eine bessere Definition ist anfällig für folgende Missverständnisse: Die Antworten sind absolut korrekt, reich an Details, knappe Antworten und ein vollständiger Denkprozess

 

Chinesische Befehle

你对学生提问,学生给出了答案,你要对参考答案和学生答案分别评分。
您必须根据相关度、完整度、语义清晰度和歧义度分别对两个答案进行评分。
最后给两个答案进行综合评分。
\n\n
提问:
"""
{question}
"""
\n\n
请对以下答案给出数字1~100之间评分:
\n\n
参考答案:
"""
{reference_answer}
"""
\n
学生答案:
"""
{student_answer}
"""
\n\n
为每个值赋予1~100之间评分,以JSON格式回复,不要其他解释:
```json
"参考答案": 
"相关度": 
"完整度": 
"语义清晰度": 
"歧义度: 
"综合评分":

"学生答案": 
"相关度": 
"完整度": 
"语义清晰度": 
"歧义度": 
"综合评分": 
```
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Die positive mehrdimensionale Bewertung beider Antworten erleichtert die Beurteilung der besten Antwort.
de_DEDeutsch