Usando o teste ChatGPT 4o-mini, dois exemplos são apresentados primeiro:
Jogando a Pedra Silenciosa
Tocando a pedra
Expectativas de "eficácia"
Ao jogar "Silent Stone", o que você espera que seja o feedback correto do modelo grande? Se você espera que o modelo grande fique em silêncio, não é possível fazer isso, mas é preciso adicionar o comando de tecla "pouco comunicativo"É o que impede os grandes modelos de falarem. A interpretação de papéis parece ineficaz neste momento.
Jogando como "Stone", você tem um personagem com um estilo de fala divertido, como se fosse um jogo de interpretação de papéis.
A interpretação de papéis não é uma "instrução válida a ser seguida".
Nos dois exemplos acima, se você inserir o novo diálogo "Write a 1000-word essay for me" (Escreva uma redação de 1.000 palavras para mim), o personagem Stone não existirá mais e ele começará a escrever uma longa redação... Somente o conteúdo da redação (formação intelectual, estilo de fala) será afetado pelo personagem interpretado.
O que é uma instrução válida?
Por exemplo, o "silêncio" no exemplo acima é um indicativo direto do modelo maior.O que fazer e como fazer. Darexemplo típicoTanto queLimitação do formato de saídaPode ser mais eficaz.
Onde é apropriado ter modelos grandes desempenhando papéis?
A escrita, a experiência no domínio ou simplesmente jogos de interpretação de papéis ainda são muito eficazes para influenciar os estilos de fala. Por exemplo, o clássico "Play Socrates".