登录 [F2] | 注册 | 找回密码 | 软件下载 | 更新历史 | 关于本站 | 管理团队
首页 排行榜 录像 雷界 论坛 教程 雷神殿 我的地盘 新手上路
[技术]Botzone 双人版扫雷游戏 (7/2089)
 [举人] 游宇凡 发表于 2021年8月16日
Botzone 是一个是在线的程序对抗平台,AI 可以根据游戏规则进行比赛一决胜负。

单人版扫雷是 Botzone 上最早就有的游戏之一,但是 Botzone 通过天梯对局的方式评判 bot 的优劣,而单人版扫雷无法进行对局,也就没有排行榜。为此,我在最近提交了 双人版扫雷 这一游戏,游戏规则为: 双方面对同一盘扫雷(不只是布雷相同,而是双方打开格子也是在同一盘扫雷中),每轮双方各选择一个要打开的格子,然后再将这两个或一个(如果双方选择同一个格子)格子打开,再进行下一轮,直到打开全部的非雷格子,或一方进行非法操作。游戏正常结束时,踩雷次数少的玩家获胜。

现在这个游戏不仅排行榜只有我一个人,玩过这个游戏的玩家,包括人类在内,也只有我和我写的 bot 

看到雷网上也有一些雷友在研究机器扫雷,所以我在这发出邀请,希望大家能将自己的 bot 提交到 Botzone 上,让这个排行榜不再只有我一个人。这样的话,一方面可能可以吸引更多人来参与这个游戏,另一方面也是测试一下这个双人版的规则是否能够有效地评判出 bot 的优劣。如果效果不错的话,这或许可以作为评判机器扫雷强弱的一个有效途径。

这个游戏也支持人机/人人对战,所以就算不写 bot,也可以注册一个号来和我的 bot 对线(

P.S. 关于我自己..上初中之后就很少玩扫雷了,有时一时兴起会玩几盘,其实破了一些 NF 的纪录,但是由于没有破 FL 的纪录,又很多年没在雷网活跃了,于是就没上传。现在的话,是上大学前的暑假。
最近一次修改:2021-8-16 11:16:44
回复此主题
第 1 楼
 [雷神] 王嘉宁 回复于 2021年8月16日
游大佬真强
不过感觉此类双人扫雷类似于棋类,也就是离散动作空间、状态空间的有限回合非合作博弈最优策略,此类问题应该一律是深度强化学习方法取得了SOTA。现在的问题是扫雷缺少好用的工具箱,让人不得不一遍一遍重造轮子。要是轮子造好了用经典方法写AI也不难。
第 2 楼
 [举人] 游宇凡 回复于 2021年8月16日
> 不过感觉此类双人扫雷类似于棋类,也就是离散动作空间、状态空间的有限回合非合作博弈最优策略,此类问题应该一律是深度强化学习方法取得了SOTA。

感觉这个和棋类区别挺大的吧,毕竟扫雷是非完全信息,而且双方是对称的,也不是要怎样“赢过对手”,而是比对手判雷更准确。我感觉双人版和单人版区别并不太大,主要是,打开一个格子时会为对方提供信息,这样的话比如说猜雷时可能就不太考虑提供的信息量而只用考虑安全程度。不是很懂“类似于棋类”具体指什么,难道会使扫雷策略有很大的变化吗?
第 3 楼
 [雷神] 王嘉宁 回复于 2021年8月16日
em。。。牌类是非完全信息的,其SOTA也是深度强化学习方法取得的
第 4 楼
 [举人] 游宇凡 回复于 2021年8月16日
反正,我设计这个规则时,想的就是,如果双方都把这当作单人版扫雷来决策,这个规则下就会非常公平,因为每次作出决策时双方面对的局面都是完全相同的。没有想过在这个规则下策略会和单人版有什么大的不同... 
第 5 楼
 [雷神] 王嘉宁 回复于 2021年8月16日
我的理解是这个规则就是用来比较AI判雷能力、解开局面的能力的,那相比之下开率这种指标可能就更加直接,当然,提出此类规则也是有利的。不过就求解器水平而言,不得不提到大名鼎鼎的JSMinesweeper,其求解速度比其他求解器快3-4个数量级,让人望尘莫及。不得不说发达国家空闲的人就是多。。
第 6 楼
 [举人] 游宇凡 回复于 2021年8月16日
> 我的理解是这个规则就是用来比较AI判雷能力、解开局面的能力的,那相比之下开率这种指标可能就更加直接

是这样,问题是比较开率大小在 Botzone 上是不现实的。
第 7 楼
 [雷圣] 张少武 回复于 2021年8月17日
时隔六年发帖,最强小学生变成最强大一新生
  共 7 篇回复  首页 | 上一页 | 下一页 | 末页  现在是第 1/1 页
楼主信息
Copyright @ 2008 扫雷网 Saolei.wang 版权所有 陕ICP备19026089号-1