观看多个大模型进行”狼人杀“推理游戏竞技，测验谁的推理能力更强！

56.9K 00

综合介绍

LLM Mafia Game Competition 是由 OpenNumbers 团队开发的一个创新在线平台，专注于让人工智能语言模型（LLM）参与“狼人杀”风格的推理对战。用户可以在这里观看大模型扮演不同角色，体验AI在复杂社交推理中的表现，同时查看模型性能统计和历史游戏记录。该平台不仅适合AI技术爱好者研究模型能力，也为游戏玩家提供了一个新奇的观战体验。通过开源支持和实时互动，它将AI技术与经典游戏结合，展现了大模型的逻辑与语言生成实力。

claude-3.7-sonnet 好腹黑...

功能列表

实时模型对战: 展示大模型扮演狼人杀角色的实时推理游戏。
模型性能统计: 提供参与对战模型的数据分析，如胜率和推理表现。
历史游戏记录: 保存近期对战详情，供用户回看和分析。
开源代码访问: 链接至 GitHub 仓库，方便开发者研究或扩展。
多模型竞技: 支持不同语言模型同台对战，突出各自特点。

使用帮助

如何访问和使用网站

LLM Mafia Game Competition 是一个无需安装的在线平台，用户只需通过浏览器访问 https://mafia.opennumbers.xyz/ 即可开始体验。以下是详细的使用指南，让您快速上手并深入探索大模型对战狼人杀的乐趣。

1. 进入网站并熟悉界面

操作步骤:
1. 打开浏览器，输入 https://mafia.opennumbers.xyz/。
2. 进入主页面后，你会看到导航栏（包含“Model Statistics”和“Recent Games”）和主区域（展示当前游戏或概览）。
3. 底部通常有 GitHub 链接，用于访问项目源码。
注意事项:
- 无需注册或登录，直接浏览即可。
- 初次访问时，建议先观察页面布局，了解各功能入口。

2. 观看大模型实时对战

操作步骤:
1. 在主页找到标有“Live Game”或类似标识的区域（视版本更新而定）。
2. 点击进入，观看大模型扮演狼人杀角色（如村民、狼人、预言家）的实时对战。
3. 系统会显示模型间的对话和推理过程，例如某个模型指认“狼人”或辩解身份。
特色功能:
- 动态更新: 对战内容实时刷新，用户可随时加入观看。
- 对话展示: 每轮发言清晰记录，展现模型的语言生成能力。
使用建议:
- 注意观察模型的推理逻辑，比如是否通过对话细节发现线索。
- 如果你是AI爱好者，可以记录模型的发言策略，用于分析或学习。

3. 查看模型性能统计

操作步骤:
1. 点击导航栏的“Model Statistics”。
2. 进入后，查看表格或图表，了解参与对战模型的表现数据。
3. 数据可能包括胜率、发言频率、被淘汰次数等。
特色功能:
- 对比分析: 直观比较不同模型在狼人杀中的强弱。
- 技术洞察: 为研究者提供模型在推理任务中的表现参考。
使用建议:
- 如果你关注某个模型（如Grok），可以重点查看它的胜率和策略。
- 将统计数据与实际对战结合，分析模型的优劣势。

4. 浏览历史对战记录

操作步骤:
1. 点击“Recent Games”选项。
2. 浏览最近完成的对战列表，选择一场点击进入。
3. 查看详细记录，包括角色分配、每轮对话和最终结果。
特色功能:
- 完整回放: 保留每场对战的全部过程。
- 研究素材: 提供AI对话样本，适合技术分析或教学使用。
使用建议:
- 选择一场精彩的对战（例如狼人获胜），分析模型的策略差异。
- 如果你是游戏玩家，可以从中学习AI的推理思路。

5. 通过 GitHub 深入参与

操作步骤:
1. 在页面底部找到“GitHub”链接，点击跳转至项目仓库。
2. 查看开源代码、文档和贡献指南。
3. 下载代码后，可在本地运行或修改游戏逻辑。
特色功能:
- 开源支持: 用户可自由获取代码，搭建自己的对战实例。
- 社区协作: 开发者可提交新功能或优化建议。
使用建议:
- 如果你有编程能力，尝试调整模型参数或添加新角色。
- 阅读 GitHub 的 README 文件，了解部署步骤和技术细节。

使用小贴士

网络要求: 确保网络稳定，以免实时对战加载中断。
浏览器兼容性: 推荐使用 Chrome 或 Firefox，效果更佳。
互动探索: 如果你是技术用户，可结合统计和对战记录，研究模型在不同场景下的表现。

通过以上步骤，你可以轻松体验 LLM Mafia Game Competition 的核心功能，无论是观看大模型的对战表现，还是深入研究其推理能力，这个平台都能满足你的需求。

最新AI资源 # AI开放服务

文章版权归 AI分享圈所有，未经允许请勿转载。

093.8K

pdf2htmlEX：PDF无损转换为HTML，保持文本格式，适用于学术论文和杂志排版

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

062.1K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

观看多个大模型进行”狼人杀“推理游戏竞技，测验谁的推理能力更强！

综合介绍

功能列表