Une nouvelle approche de l'incitation - l'incitation analogique
J'ai lu aujourd'hui un article intéressant intitulé "LaLes grands modèles de langage comme raisonneurs analogiques Une nouvelle approche des messages-guides est mentionnée - "Messages-guides analogiques".
Si vous êtes familier avec l'ingénierie des indices, vous avez certainement entendu parler de la CoT (chaîne de pensée), qui peut améliorer de manière significative la capacité de raisonnement des grands modèles de langage (LLM). Cependant, lors de l'utilisation de la CoT, nous devons fournir des conseils pertinents ou des exemples de raisonnement pour guider le modèle.
Les deux méthodes de CoT couramment utilisées sont : "0-shot CoT" et "few-shot CoT". 0-shot CoT consiste à donner explicitement les étapes de l'inférence dans l'invite et à laisser le MLD se référer aux étapes pour compléter l'inférence. Le CoT 0-shot consiste à donner les étapes de raisonnement explicitement dans l'invite et à laisser le MLD se référer aux étapes pour compléter le raisonnement. Le CoT few-shot consiste à donner un petit nombre d'exemples et à laisser le MLD se référer aux exemples pour compléter le raisonnement.

Comparaison de trois méthodes d'incitation
Par exemple, il existe désormais une question de mathématiques : "Il existe un carré dont les quatre sommets sont (-2, 2), (2, -2), (-2, -6) et (-6, -2), quelle est l'aire de ce carré ? "
Si vous n'utilisez pas le CoT, vous vous contentez de lancer le problème au LLM et de le laisser trouver la réponse. Ce problème devrait pouvoir être résolu pour le GPT-4, mais il est probable qu'il soit erroné pour le GPT-3.5, et encore plus pour d'autres modèles dont le raisonnement est plus faible.
Si vous utilisez un CoT à 0 coup, il suffit de donner les étapes d'inférence explicitement dans l'invite, par exemple :
Veuillez suivre les étapes ci-dessous pour effectuer le calcul :
1, calculez d'abord la distance entre deux sommets adjacents comme étant la longueur du côté du carré.
2、Calculer le carré de la longueur du côté pour obtenir la surface carrée
En suivant ces étapes, vous obtiendrez des résultats corrects pour un LLM avec un GPT de 3,5.
Si vous utilisez le CoT à quelques coups, alors il donne un petit nombre d'exemples, par exemple :
Q : Voici un carré dont les quatre sommets sont (0, 0), (1, 1), (0, 1), et (1, 0).Quelle est l'aire de ce carré ?
R : Nous choisissons deux sommets voisins, disons (0, 0) et (1, 1), nous calculons leurs distances pour obtenir une longueur d'arête de 1, puis nous calculons le carré de la longueur d'arête pour obtenir une surface de 1.
Q : Il existe un carré dont les quatre sommets sont (-2, 2), (2, -2), (-2, -6), et (-6, -2).Quelle est l'aire du carré ?
Nous donnons explicitement un exemple dans l'invite, indiquant au LLM qu'il doit suivre les étapes de l'exemple, afin qu'il puisse obtenir le résultat correct pour un LLM tel que GPT-3.5.
Qu'est-ce que le "repérage analogique" ?
Pensez à l'époque où vous appreniez les mathématiques à l'école. Si vous devez répondre à une question de ce type, vous vous demanderez si vous avez déjà répondu à des questions similaires, surtout si vous êtes un petit citadin comme moi, car je ne sais pas combien de copies j'ai passées à l'époque.
La réserve de connaissances du LLM est plus importante que celle des êtres humains et il a accumulé toutes sortes de connaissances et de cas au cours de sa formation. Nous devons donc "stimuler" le LLM pour qu'il trouve les connaissances et les cas liés au problème, puis les utiliser pour raisonner et résoudre le problème.
La "méthode des indices analogiques" consiste donc à laisser le LLM ne pas se précipiter pour résoudre le problème en premier lieu, mais à énumérer d'abord un certain nombre d'exemples liés au problème, puis à utiliser ces exemples pour raisonner afin de résoudre le problème. Cela équivaut à laisser le LLM vous aider à rédiger un petit texte, en vous aidant à générer une chaîne de pensée.
C'est un peu comme lorsque vous obtenez un problème de mathématiques et que vous lui demandez d'abord de suivre ce problème de mathématiques pour trouver des exemples similaires et des réponses de référence, puis de suivre ces exemples et ces réponses de référence pour résoudre le problème d'origine.
La structure de Prompt est la suivante :
Question initiale : \
Problèmes connexes : pensez à trois problèmes connexes et uniques et décrivez chaque problème et sa solution.
Résoudre le problème initial :
Demandez au LLM, dès qu'il reçoit le problème, de se souvenir de trois problèmes liés et uniques et de lister chaque problème et solution (de préférence avec des étapes), et assurez-vous d'imprimer les processus intermédiaires. Lorsque le LLM a fini de produire ces exemples pertinents, imprimez à nouveau le problème original (pour éviter de l'oublier), afin que le LLM puisse utiliser ces exemples pertinents pour raisonner sur le problème original.
Une référence complète à Prompt utilisant des indices analogiques :
Votre tâche consiste à résoudre des problèmes mathématiques. Lorsqu'un problème mathématique vous est présenté, rappelez-vous quelques sujets connexes à titre d'exemple. Ensuite, revenez en arrière et résolvez le tout premier problème.
# La toute première question :
Une compagnie aérienne offre un dîner à chaque passager de l'avion, qui peut choisir entre un steak ou un poisson. Trois des six membres de l'équipage peuvent choisir le steak et trois peuvent choisir le poisson. Si les plats sont attribués au hasard, quelle est la probabilité que les deux pilotes choisissent le poisson ?
# Guide d'utilisation :
Les points suivants doivent être inclus dans votre réponse :
## Questions connexes :
Pensez à trois problèmes de mathématiques liés au tout premier problème en guise d'exemples. Notez que chaque problème doit être différent des autres, y compris du tout premier (par exemple, en impliquant des nombres et des noms différents). Chaque problème doit suivre le format ci-dessous :
- Q :" suivi d'une description du problème
- A :" suivi de la solution du problème et écrire la réponse finale dans l'encadré.
## Résoudre le problème dès le début :
Dites : "Résolvons le problème de mathématiques suivant". Répondez ensuite dans le format suivant :
Q : Copiez et collez la toute première question ici.
A : Expliquez la solution et écrivez la réponse finale dans l'encadré.
LLM produira le résultat suivant :
## Questions connexes :
### Question 1 :
- Lors d'une fête, tout le monde a le choix entre une tarte aux pommes et une glace à la vanille. Cinq femmes choisissent la tarte aux pommes et cinq autres choisissent la glace à la vanille. Si les desserts sont attribués au hasard, quelle est la probabilité que les deux femmes reçoivent de la glace à la vanille ?
- **A:** Utilisez le calcul combinatoire pour résoudre ce problème. Le moyen total est de choisir deux des cinq femmes qui peuvent choisir une glace, soit \N( \Nbinom{5}{2} = 10 \Nmoyens). Et la distribution totale consiste à choisir deux femmes sur dix, soit \N( \Nbinom{10}{2} = 45 \N) façons. La probabilité est donc de \N( \frac{10}{45} = \frac{2}{9} \N). La réponse finale est \N( \cboxed{\frac{2}{9}} \N).
### Question 2 :
- Lors d'un dîner, chaque personne a le choix entre un vin rouge et un vin blanc. Quatre hommes peuvent choisir du vin rouge et quatre hommes peuvent choisir du vin blanc. Si les vins sont attribués au hasard, quelle est la probabilité que les trois hommes obtiennent du vin blanc ?
- **A:** En utilisant une méthode similaire, trois hommes sont choisis parmi les quatre hommes qui ont le choix du vin blanc de \( \binom{4}{3} = 4 \N façons). Et la distribution totale est faite en choisissant trois hommes sur huit, c'est-à-dire \( \binom{8}{3} = 56 \N) façons. La probabilité est donc de \( \frac{4}{56} = \frac{1}{14} \). La réponse finale est \( \boxed{\frac{1}{14}} \).
### Question 3 :
- Q:** Dans le café, chaque personne peut choisir un café au lait ou un cappuccino. Trois clients peuvent choisir un café au lait et trois clients peuvent choisir un cappuccino. Quelle est la probabilité qu'un client obtienne un cappuccino si le café est attribué au hasard ?
- A:** Dans ce cas, il y a \N( \Nbinom{3}{1} = 3 \N) façons de choisir un client qui peut avoir un cappuccino. L'allocation totale consiste à choisir un client parmi six, c'est-à-dire \( \binom{6}{1} = 6 \N) façons. La probabilité est donc de \( \frac{3}{6} = \frac{1}{2} \). La réponse finale est \N( \cboxed{\frac{1}{2}} \N).
## Résolvons le problème mathématique suivant.
### Q : Une compagnie aérienne offre un dîner à tous les passagers d'un avion, qui peuvent choisir entre un steak ou du poisson. Trois des six membres de l'équipage peuvent choisir un steak et trois peuvent choisir un poisson. Si les plats sont attribués au hasard, quelle est la probabilité que les deux pilotes choisissent le poisson ?
### A : Nous pouvons utiliser une solution similaire pour ce problème. Nous avons trois pilotes qui peuvent choisir le poisson, et nous voulons en choisir deux. Cela se fait de \N( \Nbinom{3}{2} = 3 \N) façons. La répartition totale est de deux pilotes sur six, soit \N( \Nbinom{6}{2} = 15 \N) façons. La probabilité est donc de \( \frac{3}{15} = \frac{1}{5} \). La réponse finale est \( \boxed{\frac{1}{5}} \).
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...