méso (chimie)Meeseeks - Ensemble d'évaluation open-source Meeseeks pour évaluer la capacité à suivre les instructions d'un modèle
Meeseeks est un ensemble d'évaluation de grands modèles open source utilisé par l'équipe M17 de Meituan pour évaluer la capacité d'un modèle à suivre les instructions. Meeseeks utilise un cadre d'évaluation à trois niveaux pour mesurer de manière exhaustive si un modèle est capable de générer des réponses en stricte conformité avec les instructions de l'utilisateur, du niveau macro au niveau micro, et n'évalue pas la connaissance du contenu de la réponse comme un élément positif....