LangChain Hub #1 Tippgeber auf Chinesisch. Vor über einem Jahr veröffentlicht und für die Gesamtbewertung der kombinierten Ergebnisse verschiedener RAG-Strategien verwendet. Übersetzt und angepasst für die Verwendung in mehreren Sprachen.
Hilfe verwenden
Beurteilen Sie, welche Antwort besser ist, unter der Annahme, dass beide Antworten richtig sind. Beurteilen Sie, welche Antworten "wahrscheinlich" problematisch sind, da der Unterschied in den zusammengesetzten Punktzahlen größer als 1 ist. Bei Antworten, die mit hoher Wahrscheinlichkeit richtig sind, ist es sicher, die Wissensbasis zu überschreiben.
Anwendungsbereiche:
- Wird verwendet, um verschiedene "extrahierte QA-Paar-Stichwörter" zu bewerten und festzustellen, welches Stichwort besser ist.
- Wird verwendet, um zu beurteilen, ob die Antworten der Schüler (neue RAG-Strategie) besser sind, wenn die Referenzantwort als Basisstandardantwort verwendet wird
Eine bessere Definition ist anfällig für folgende Missverständnisse: Die Antworten sind absolut korrekt, reich an Details, knappe Antworten und ein vollständiger Denkprozess
Chinesische Befehle
Sie stellen dem Schüler eine Frage, der Schüler gibt eine Antwort, und Sie müssen die Referenzantwort und die Antwort des Schülers getrennt bewerten. Sie müssen beide Antworten auf der Grundlage von Relevanz, Vollständigkeit, semantischer Klarheit und Mehrdeutigkeit getrennt bewerten. Geben Sie schließlich eine kombinierte Note für beide Antworten. \n\n Stellen Sie eine Frage: """ {Frage} """ \n\n Bitte bewerten Sie die folgenden Antworten, indem Sie eine Zahl zwischen 1 und 100 angeben: \n\n Referenzantwort: """ {reference_answer} """ \n Antwort des Schülers: """ {student_answer} """ \n\n Jedem Wert eine Bewertung zwischen 1 und 100 zuweisen, Antwort im JSON-Format, keine weiteren Erklärungen: ðŸ "ðŸ "ðŸ "ðŸ "ðŸ "json "reference_answer". "Relevanz". "Vollständigkeit". "Semantische Klarheit". "Mehrdeutigkeit". "Gesamtbewertung". "Antworten der Schüler". "Relevanz". "Vollständigkeit". "Semantische Klarheit". "Mehrdeutigkeit". "Gesamtbewertung". ``