LangChain Hub #1 tipster em chinês. Lançado há mais de um ano e usado na avaliação geral das pontuações combinadas de diferentes estratégias RAG. Traduzido e adaptado para uso em vários idiomas.
Usando a Ajuda
Avalie qual resposta é melhor, supondo que ambas as respostas estejam corretas. Avaliar quais respostas são "prováveis" de serem problemáticas, considerando que a diferença nas pontuações compostas é maior que 1. Para respostas com alta probabilidade de estarem corretas, é seguro substituir a base de conhecimento.
Áreas de aplicação:
- Usado para avaliar diferentes "dicas de extração de pares de controle de qualidade" e qual dica é melhor.
- Usado para avaliar se as respostas dos alunos (nova estratégia RAG) são melhores quando a resposta de referência é usada como resposta padrão de base
Uma definição melhor é propensa aos seguintes equívocos: as respostas são absolutamente corretas, ricas em detalhes, respostas sucintas e um processo de pensamento completo
Comandos em chinês
你对学生提问,学生给出了答案,你要对参考答案和学生答案分别评分。 您必须根据相关度、完整度、语义清晰度和歧义度分别对两个答案进行评分。 最后给两个答案进行综合评分。 \n\n 提问: """ {question} """ \n\n 请对以下答案给出数字1~100之间评分: \n\n 参考答案: """ {reference_answer} """ \n 学生答案: """ {student_answer} """ \n\n 为每个值赋予1~100之间评分,以JSON格式回复,不要其他解释: ```json "参考答案": "相关度": "完整度": "语义清晰度": "歧义度: "综合评分": "学生答案": "相关度": "完整度": "语义清晰度": "歧义度": "综合评分": ```