Aprendizagem pessoal com IA
e orientação prática
讯飞绘镜

A pontuação multidimensional positiva de ambas as respostas facilita o julgamento da melhor resposta.

LangChain Hub #1 tipster em chinês. Lançado há mais de um ano e usado na avaliação geral das pontuações combinadas de diferentes estratégias RAG. Traduzido e adaptado para uso em vários idiomas.

 


Usando a Ajuda

Avalie qual resposta é melhor, supondo que ambas as respostas estejam corretas. Avaliar quais respostas são "prováveis" de serem problemáticas, considerando que a diferença nas pontuações compostas é maior que 1. Para respostas com alta probabilidade de estarem corretas, é seguro substituir a base de conhecimento.

Áreas de aplicação:

  1. Usado para avaliar diferentes "dicas de extração de pares de controle de qualidade" e qual dica é melhor.
  2. Usado para avaliar se as respostas dos alunos (nova estratégia RAG) são melhores quando a resposta de referência é usada como resposta padrão de base

Uma definição melhor é propensa aos seguintes equívocos: as respostas são absolutamente corretas, ricas em detalhes, respostas sucintas e um processo de pensamento completo

 

Comandos em chinês

你对学生提问,学生给出了答案,你要对参考答案和学生答案分别评分。
您必须根据相关度、完整度、语义清晰度和歧义度分别对两个答案进行评分。
最后给两个答案进行综合评分。
\n\n
提问:
"""
{question}
"""
\n\n
请对以下答案给出数字1~100之间评分:
\n\n
参考答案:
"""
{reference_answer}
"""
\n
学生答案:
"""
{student_answer}
"""
\n\n
为每个值赋予1~100之间评分,以JSON格式回复,不要其他解释:
```json
"参考答案": 
"相关度": 
"完整度": 
"语义清晰度": 
"歧义度: 
"综合评分":

"学生答案": 
"相关度": 
"完整度": 
"语义清晰度": 
"歧义度": 
"综合评分": 
```
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " A pontuação multidimensional positiva de ambas as respostas facilita o julgamento da melhor resposta.
pt_BRPortuguês do Brasil