登录 [F2] | 注册 | 找回密码 | 软件下载 | 更新历史 | 关于本站 | 管理团队
首页 排行榜 录像 雷界 论坛 教程 雷神殿 我的地盘 新手上路
[杂谈]独立评论:最优秀的单局指标排名.精 (7/749)
 [雷神] 王嘉宁 发表于 2024年8月26日
## 独立评论:最优秀的单局指标排名

众所周知,一局扫雷里,有66个指标,分别是:rtime, left, right, double, cl, left/s, right/s, double/s, cl/s, path, CPath, IODE, IOPE, flag, flag/s, etime, STNB, RQP, QG, IOE, Thrp, Corr, ce, ce/s, 3BV solved, 3BV/s, op solved, isl solved, 3BV, 3BVO, op, isl, cell0, cell1, cell2, cell3, cell4, cell5, cell6, cell7, cell8, fps, H. ZiNi, G. ZiNi, R. ZiNi, 8-Way ZiNi, Pttazini, ZiNi/s, ZNE, HZNE, ZNT, HZNT, Leff, Reff, Deff, Mines, Width, Height, Unflags, Waste flags, MISFLAGS, MISUNFLAGS, completion, pLuck, IOS, OBV(作为前置知识,这些指标的含义可以在此处找到:扫雷术语介绍

本排行榜考虑如下三个方面:  
- 重要度:指该指标是否与实力和练习有关,反映的问题、意义、能力或价值,是否有关注的意义。如MISFLAGS这样的指标显然和实力无关,纯粹是手速。意义也不大,单独的MISFLAGS并不能反映什么问题,可以永远不关注。Mines这样的指标也永远不会有人关注,因为只要难度固定就不会变化。相反,如flag这样的指标虽然和实力、局面难度都无关,但是关乎风格是盲扫、标雷还是全标,这就很有用、很重要。这和实际上是否关注无必然联系,因为这受到种种客观条件的约束,需要摒弃偏见后评价。  
- 可行度:指在技术层面,指标的计算方式是否具有清晰的定义,是否可以被复现和验证。假如实现困难,就难以公平地在各复刻之间比较。  
- 传播度:指计算的含义、计算方法是否可以被社区理解,是否可以一眼记住。

而不考虑如下方面:  
- 流行度:该指标是否已经被广泛使用。
- 重复性:比如IOE和Thrp一定程度上是重复的,IOS和3BV/s也是重复的,但本排行榜不考虑因为功能重复导致的重要性下降,而是独立地进行两次评价。
- 适用的风格范围:比如ZiNi/s,只有在标雷下能最大程度发挥重要度,那么本排名考虑的就是标雷下的重要度。

每个指标最多5分,综合优秀度的计算公式:综合优秀度=重要度+可行度×0.5+传播度×0.5

1. rtime:  
无可争议的王者,受到所有权威排行榜的认可。没有人不关心用时,没有人不理解用时。也是唯一被吉尼斯世界纪录认可的单局扫雷的指标。  
    > 重要度:★★★★★  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:10

2. IOE:
效率的代表性指标,同时考虑了效率和准确率,没有硬伤。
    > 重要度:★★★★★  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:10

3. 3BVO:
比较成功地解决了3BV没有考虑op的硬伤,目前为止精确衡量局面难度时,平衡复杂性和效果后的最佳结果。
    > 重要度:★★★★☆  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:9.5

4. CPath:
体现规划能力,而且可以公平地准确计算,而且运气成分小。但是不体现手稳程度。
    > 重要度:★★★★  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:9

5. 3BV:
rtime最大的硬伤就是,没有考虑到局面的难度,因此极端情况下,可能出现一秒扫开高级的情况。而3BV就是最经典的描述局面难度的指标。用3BV对rtime成绩做过滤可能是合适的,也可以用于如IOE一类的追求极限点击次数的场景;然而,3BV没有考虑op对局面难度的影响,因此不宜用于竞速时精确衡量局面难度的场合。假如需要精确衡量局面难度,进而精确衡量玩家实力,那么即使用3BV+op也比单纯3BV更好。即便如此,3BV依旧凭借其容易理解及计算的优点,得到了所有排行榜的认可。
    > 重要度:★★★★  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:9

6. flag:
判断风格是盲扫、标雷还是全标时,最重要的指标。
    > 重要度:★★★☆  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8.5

7. path:
可以体现规划能力、手稳程度,运气成分小。但是path的计算受到鼠标回报率的影响,回报率越高越吃亏,因此难以公平地准确计算。
    > 重要度:★★★★☆  
    > 可行度:★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8.5

8. IOPE:
体现手稳程度。但和path一样,受到鼠标回报率的影响,回报率越高越吃亏。
    > 重要度:★★★★☆  
    > 可行度:★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8.5

9.  3BV/s:
尝试用单位时间解决的3BV来衡量速度的指标。因此具有3BV本身相同的缺点,也就是完全没有考虑op的难度。也没有考虑不同级别、不同3BV的局面的难度差异。造成3BV越大的局面3BV/s一般也越大,初级小图的运气成分较大等结果。
    > 重要度:★★★☆  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8.5

10. pLuck:
这是唯一衡量玩家运气好坏的指标,可以说开辟了一个单独的维度。关注这个指标的最大原因就是有意思,它反映了玩家的运气到底有多好,是不是天选之人。此外也能反映玩家以猜代判的倾向性,尤其是在强可猜、弱可猜模式中,衡量猜雷的能力。
    > 重要度:★★★☆  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8.5

11. ce/s:
evf标准下的ce/s剔除了cl中无益的点击,反映了玩家在思考同时的手速,是判断手速时最重要的指标。但是阿比特标准中的ce/s则是一个自相矛盾的概念,将左键点开3BV和unflag放到同样的地位,无讨论意义。
    > 重要度:★★★☆  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8.5

12. Thrp:
反映了点击的效率,但没有考虑准确率。
    > 重要度:★★★☆  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8.5

13. STNB:
尝试通过拟合修正,在大图和小图间取得平衡。但是仍然是基于3BV,具有相同的缺点。而且拟合结果不够精确、初级小图的运气成分较大。重要度方面比3BV/s优秀一点,但是公式复杂无法记忆。
    > 重要度:★★★★  
    > 可行度:★★★★★  
    > 传播度:★★★☆  
    > 综合优秀度:8.25

14. Corr:
反映了点击的准确率,完全是操作的精确度,一般都差不多所以不看。
    > 重要度:★★★  
    > 可行度
最近一次修改:2024-8-26 19:42:18
回复此主题
第 1 楼
 [雷神] 王嘉宁 回复于 2024年8月26日
14. Corr:
反映了点击的准确率,完全是操作的精确度,一般都差不多所以不看。
    > 重要度:★★★  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8

15. op:
统计分析发现op和rtime之间有一定的相关性。
    > 重要度:★★★  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8

16. cl/s:
判断手速时,第二重要的指标。
    > 重要度:★★★  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:8

17. IODE:
反映规划能力和手稳程度,并用3BV对path进行修正。优点不多,但同时兼具3BV和path的硬伤。
    > 重要度:★★★☆  
    > 可行度:★★★  
    > 传播度:★★★★★  
    > 综合优秀度:7.5

18. Pttazini:
这个指标实现了较为细致的优化工作,最有参考价值。可惜源码是js写的,对其他复刻开发者来说使用困难。
    > 重要度:★★★★  
    > 可行度:★☆  
    > 传播度:★★★★★  
    > 综合优秀度:7.25

19. ZiNi/s:
受到G. ZiNi的缺点的限制,综合优秀度非常一般。
    > 重要度:★★★☆  
    > 可行度:★☆  
    > 传播度:★★★★★  
    > 综合优秀度:6.75

20. G. ZiNi:
三个ZiNi都是对最小点击数的近似,由于都只是朴素的近似算法,因此参考价值一言难尽。G. ZiNi算法在实现方面也有问题,已有的两个实现所用的语言分别为Delphi和js,其他复刻要想复现难免出现不一致,因此可行性只有1.5分。
    > 重要度:★★★☆  
    > 可行度:★☆  
    > 传播度:★★★★★  
    > 综合优秀度:6.75

21. OBV:
在拟合思想的指导下,企图找到精确衡量局面难度指标的一次尝试。然而这个结果首先是反常识的,op绝不至于比岛上的格子重要5倍以上,另外numbers的定义也毫无道理。因此,没有人会关注这个指标,只能算一次勇敢的尝试。
    > 重要度:★★☆  
    > 可行度:★★★★★  
    > 传播度:★★★  
    > 综合优秀度:6.5

22. isl:
道理上,isl多的局面死猜会变多,这是说得通的,因为各岛上的数字提供的信息无法相互支援。然而,没有证据表明isl会影响时间。
    > 重要度:★  
    > 可行度:★★★★★  
    > 传播度:★★★★★  
    > 综合优秀度:6

23. RQP:
认为3BV/s需要进一步除时间来修正,但并非如QG一样基于拟合,是没有道理的。
    > 重要度:★☆  
    > 可行度:★★★★★  
    > 传播度:★★★★  
    > 综合优秀度:6

24. IOS:
最大的硬伤是数值被缩放的范围太小,对时间求偏导仅仅为$ - \frac{{lo{g_{10}}\left( {3BV} \right)}}{{{\rm{2}}{\rm{.3time}}{{\left( {lo{g_{10}}\left( {time} \right)} \right)}^2}}} $,且在time=1处有奇点。
    > 重要度:☆  
    > 可行度:★★★★★  
    > 传播度:★★★★  
    > 综合优秀度:5
第 2 楼
 [雷圣] 钱旭程 回复于 2024年8月26日
狠狠点了,最优秀的一集!
第 3 楼
 [雷圣] 裴祺 回复于 2024年8月27日
第 4 楼
 [雷神] 林艺海 回复于 2024年9月9日
我提出过分形维数可能也是不错的路线复杂度指标(不过jsd不这么认为
第 5 楼
 [雷神] 王嘉宁 回复于 2024年9月10日
目前需要的是精确衡量实力的指标。这个指标需要能够解决3BV/s的两个缺陷,一:3BV/s基于3BV,而3BV只是局面难度的粗略估计,并不精确;二:大图难度更小、小图难度更大,因此直接time必须加大于1的指数。该指标将比3BV/s更稳定。

虽然已有的所有排名网站都不会接纳新的指标,但是开源扫雷网的全部工具链都随时准备接受真正优秀的指标,因此不需要削足适履。
第 6 楼
 [书生] 李翔翔 回复于 2024年9月11日
用扫雷程序通关的时间能不能算一个指标,时间越长就越难
第 7 楼
 [雷神] 王嘉宁 回复于 2024年9月12日
程序求解速度方面JSMinesweeper第一,ms_toollib第二。要是能更快也有意思。
  共 7 篇回复  首页 | 上一页 | 下一页 | 末页  现在是第 1/1 页
楼主信息
Copyright @ 2008 扫雷网 Saolei.wang 版权所有 陕ICP备19026089号-1