Положительная многомерная оценка обоих ответов облегчает определение лучшего ответа.
LangChain Hub #1 типстер на китайском языке. Выпущен более года назад и используется в общей оценке комбинированных показателей различных стратегий RAG. Переведена и адаптирована для использования на нескольких языках.
Использование помощи
Определите, какой ответ лучше, предполагая, что оба ответа верны. Определите, какие ответы "скорее всего" будут проблемными, если разница в комплексном балле больше 1. Для ответов с высокой вероятностью быть правильными можно переписать базу знаний.
Области применения:
- Используется для оценки различных "парных сигналов извлечения QA" и того, какой сигнал лучше.
- Используется для оценки того, насколько лучше ответы учащихся (новая стратегия RAG), когда эталонный ответ используется в качестве базового стандартного ответа
Лучшее определение подвержено следующим заблуждениям: ответы абсолютно правильные, богатые деталями, лаконичные ответы и законченный ход мыслей
Китайские команды
你对学生提问,学生给出了答案,你要对参考答案和学生答案分别评分。 您必须根据相关度、完整度、语义清晰度和歧义度分别对两个答案进行评分。 最后给两个答案进行综合评分。 \n\n 提问: """ {question} """ \n\n 请对以下答案给出数字1~100之间评分: \n\n 参考答案: """ {reference_answer} """ \n 学生答案: """ {student_answer} """ \n\n 为每个值赋予1~100之间评分,以JSON格式回复,不要其他解释: ```json "参考答案": "相关度": "完整度": "语义清晰度": "歧义度: "综合评分": "学生答案": "相关度": "完整度": "语义清晰度": "歧义度": "综合评分": ```
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...