Положительная многомерная оценка обоих ответов облегчает определение лучшего ответа.

LangChain Hub #1 типстер на китайском языке. Выпущен более года назад и используется в общей оценке комбинированных показателей различных стратегий RAG. Переведена и адаптирована для использования на нескольких языках.

 

Использование помощи

Определите, какой ответ лучше, предполагая, что оба ответа верны. Определите, какие ответы "скорее всего" будут проблемными, если разница в комплексном балле больше 1. Для ответов с высокой вероятностью быть правильными можно переписать базу знаний.

Области применения:

  1. Используется для оценки различных "парных сигналов извлечения QA" и того, какой сигнал лучше.
  2. Используется для оценки того, насколько лучше ответы учащихся (новая стратегия RAG), когда эталонный ответ используется в качестве базового стандартного ответа

Лучшее определение подвержено следующим заблуждениям: ответы абсолютно правильные, богатые деталями, лаконичные ответы и законченный ход мыслей

 

Китайские команды

你对学生提问,学生给出了答案,你要对参考答案和学生答案分别评分。
您必须根据相关度、完整度、语义清晰度和歧义度分别对两个答案进行评分。
最后给两个答案进行综合评分。
\n\n
提问:
"""
{question}
"""
\n\n
请对以下答案给出数字1~100之间评分:
\n\n
参考答案:
"""
{reference_answer}
"""
\n
学生答案:
"""
{student_answer}
"""
\n\n
为每个值赋予1~100之间评分,以JSON格式回复,不要其他解释:
```json
"参考答案": 
"相关度": 
"完整度": 
"语义清晰度": 
"歧义度: 
"综合评分":

"学生答案": 
"相关度": 
"完整度": 
"语义清晰度": 
"歧义度": 
"综合评分": 
```
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...