Regardez plusieurs grands mannequins s'affronter dans un jeu de raisonnement de loup-garou pour tester qui a les meilleures capacités de raisonnement !

Introduction générale

La compétition LLM Mafia Game est une plateforme en ligne innovante développée par l'équipe OpenNumbers qui se concentre sur l'engagement de modèles de langage IA (LLM) dans des matchs de raisonnement de type Wolfsbane. Les utilisateurs peuvent regarder les LLM jouer différents rôles, découvrir les performances de l'IA dans des raisonnements sociaux complexes et consulter les statistiques de performance des modèles et l'historique des jeux. La plateforme convient non seulement aux passionnés de technologie de l'IA pour étudier les capacités des modèles, mais elle offre également une nouvelle expérience de visualisation aux joueurs. Grâce à un support open source et à une interaction en temps réel, elle associe la technologie de l'IA à des jeux classiques pour démontrer la force de génération de logique et de langage des grands modèles.

claude-3.7-sonnet Le ventre...

观看多个大模型进行”狼人杀“推理游戏竞技,测验谁的推理能力更强!

 

Liste des fonctions

  • Bataille de modèles en temps réel: Un jeu de déduction en temps réel montrant de grands mannequins jouant le rôle de tueurs de loups-garous.
  • Statistiques sur les performances du modèle: : Fournir des analyses de données sur la participation aux modèles de mise en relation, telles que les taux de victoire et les performances en matière de raisonnement.
  • Historique des jeuxLes utilisateurs peuvent ainsi consulter et analyser les détails des derniers matches.
  • accès libreLiens vers des dépôts GitHub pour que les développeurs puissent effectuer des recherches ou des extensions.
  • concours multi-modèles: : prendre en charge différents modèles linguistiques sur la même scène, en mettant en évidence leurs caractéristiques respectives.

 

Utiliser l'aide

Comment accéder au site et l'utiliser

LLM Mafia Game Competition est une plateforme en ligne qui ne nécessite aucune installation et à laquelle les utilisateurs accèdent simplement par le biais de leur navigateur. https://mafia.opennumbers.xyz/ pour commencer l'expérience. Voici un guide détaillé qui vous permettra d'être rapidement opérationnel et de vous plonger plus profondément dans le plaisir de Big Model Versus Werewolf.

1. accès au site web et familiarisation avec l'interface

  • procédure:
    1. Ouvrez votre navigateur et tapez https://mafia.opennumbers.xyz/.
    2. Une fois sur la page principale, vous verrez la barre de navigation (contenant "Statistiques du modèle" et "Jeux récents") et la zone principale (montrant le jeu en cours ou la vue d'ensemble).
    3. Il y a généralement un lien GitHub au bas de la page pour accéder au code source du projet.
  • mise en garde:
    • Il n'est pas nécessaire de s'inscrire ou de se connecter, il suffit de naviguer.
    • Lors de la première visite, il est recommandé d'observer d'abord la mise en page pour comprendre les entrées de chaque fonction.

2. regarder les grands modèles s'affronter en temps réel

  • procédure:
    1. Sur la page d'accueil, trouvez la zone intitulée "Jeu en direct" ou similaire (en fonction de la mise à jour).
    2. Cliquez ici pour assister à des combats en temps réel entre de grands mannequins jouant des personnages tueurs de loups-garous (villageois, loups-garous, prophètes, etc.).
    3. Le système affiche le dialogue et les processus de raisonnement entre les modèles, par exemple lorsqu'un modèle identifie un "loup-garou" ou défend son identité.
  • Fonctions vedettes:
    • mise à jour dynamique (Internet)Le contenu de la bataille est actualisé en temps réel, de sorte que les utilisateurs peuvent participer et regarder à tout moment.
    • Vitrine du dialogueLe modèle a été conçu de manière à ce qu'il soit possible d'obtenir des informations sur l'état d'avancement de la mise en œuvre de la politique.
  • Recommandations d'utilisation:
    • Prêtez attention à la logique de raisonnement du modèle, par exemple si les indices sont détectés à travers les détails du dialogue.
    • Si vous êtes un passionné d'IA, vous pouvez enregistrer la stratégie d'élocution d'un modèle à des fins d'analyse ou d'apprentissage.

3) Visualisation des statistiques de performance du modèle

  • procédure:
    1. Cliquez sur "Statistiques du modèle" dans la barre de navigation.
    2. Une fois les données saisies, consultez le tableau ou le graphique pour obtenir les données de performance des modèles de combat participants.
    3. Les données peuvent inclure le taux de victoire, la fréquence des déclarations, le nombre d'éliminations, etc.
  • Fonctions vedettes:
    • analyse comparative: : Comparer intuitivement les forces et les faiblesses de différents modèles d'abattage de loups-garous.
    • Aperçu de la technologieObjectif : Fournir aux chercheurs une référence pour les performances des modèles dans les tâches de raisonnement.
  • Recommandations d'utilisation:
    • Si vous suivez un modèle particulier (par exemple Grok), vous pouvez vous concentrer sur son taux de réussite et sa stratégie.
    • Combinez les données statistiques avec les mises en relation réelles pour analyser les forces et les faiblesses du modèle.

4. afficher l'historique de la bataille

  • procédure:
    1. Cliquez sur l'option "Jeux récents".
    2. Parcourez la liste des matchs récemment terminés et sélectionnez-en un dans lequel vous pouvez cliquer.
    3. Consultez les enregistrements détaillés, y compris l'attribution des rôles, chaque tour de dialogue et les résultats finaux.
  • Fonctions vedettes:
    • Reprise intégrale: : Conserver l'intégralité de chaque match.
    • Matériel de recherche: : Fournir des exemples de dialogues d'IA adaptés à l'analyse technique ou à l'utilisation pédagogique.
  • Recommandations d'utilisation:
    • Choisissez un match intéressant (par exemple, la victoire d'un loup-garou) et analysez les différences de stratégies entre les modèles.
    • Si vous êtes un joueur, vous pouvez apprendre l'esprit de raisonnement de l'IA grâce à elle.

5. un engagement plus profond grâce à GitHub

  • procédure:
    1. Trouvez le lien "GitHub" au bas de la page et cliquez dessus pour accéder au dépôt du projet.
    2. Voir le code source ouvert, la documentation et les directives de contribution.
    3. Téléchargez le code et exécutez-le localement ou modifiez la logique du jeu.
  • Fonctions vedettes:
    • Soutien à l'Open SourceLes utilisateurs ont un accès libre au code pour créer leurs propres instances de matchmaking.
    • Collaboration communautaireLes développeurs peuvent soumettre des suggestions de nouvelles fonctionnalités ou d'optimisations.
  • Recommandations d'utilisation:
    • Si vous avez des compétences en programmation, essayez de modifier les paramètres du modèle ou d'ajouter de nouveaux caractères.
    • Lisez le fichier README de GitHub pour les étapes de déploiement et les détails techniques.

Conseils d'utilisation

  • exigences en matière de réseauLe réseau est stable afin d'éviter les interruptions dans le chargement des batailles en temps réel.
  • Compatibilité avec les navigateursPour de meilleurs résultats, il est recommandé d'utiliser Chrome ou Firefox.
  • Exploration interactiveSi vous êtes un utilisateur technique, étudiez les performances du modèle dans différents scénarios à l'aide de statistiques et d'enregistrements de matchmaking.

Que vous souhaitiez regarder les grands modèles s'affronter ou approfondir leurs capacités de raisonnement, cette plateforme est faite pour vous.

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...