摘要:采用图像处理领域方法,引入信息熵研究雷图。研究表明,雷图的3BV越大,则信息熵越小;3BV相同,信息熵越大,局面看起来越难。雷图信息熵作为一个易于求得、意义明确的特征值,在未来有望成为计算或衡量局面难度的重要工具。 关键词:信息熵,局面难度,图像处理方法 1. 信息熵的算法与含义 作者首先通过算法随机生成雷图,1代表雷,0代表非雷;将矩阵的边界延拓,然后对雷图3*3均值滤波后乘9;最后用公式entropy=-∑p(i)log(2,p(i)),i=0,2,…,9计算信息熵,其中p(i)表示数字i在该雷图中的比例。
最初熵在热力学领域被用来表示系统的混乱程度。后来被引入信息论领域用来定量表达信息量的大小。计算雷图的信息熵相当于定量描述雷图的“混乱程度”,对于指定的雷图,如果局面中只有1,那么计算得到的信息熵最小,如果数字0到9都出现且出现次数相同,那么计算得到的信息熵最大。
初次了解这个概念的雷友需要注意,信息熵的值只和数字的数量有关,而与数字的位置无关。 2. 信息熵与3BV关系 图1 如图,通过计算10000组(信息熵,3BV)值,可得,3BV越大,则信息熵越小。
将相同3BV,不同信息熵的雷图进行比较,图2为(173,2.078); 图2 图3为(173,2.385) 图3 图2中有约17块OP,而图3中有约3块,作者认为他们的难度是不同的。目前已有计算局面难度算法,只能通过计算扫开后的3BV/S与个人平均3BV/S的比值。本文提出的计算信息熵的方法,可能可以无需扫开就事先计算局面难度。 3. 其他计算局面难度的思路与未来展望 谈到局面难度就不得不提起猜雷次数这个重要的特征值。目前在公开的文献中没有相关算法。这个问题将在以后被重点研究。
作者放弃的一个思路是,对雷图的每中3*3局部赋权,再加权求和。这种方法含义不明确,且权值难确定,遂放弃。
另一种思路是大量搜集同一玩家的录像,计算已知成绩的雷图的特征值,以特征值为输入,成绩为输出,训练神经网络。或者其他数据挖掘算法不再赘述。这个思路是可行的,但是有两个前提,一是选取雷图的若干特征值,上文提到的信息熵亦可成为输入神经网络的特征值之一;二是同一玩家的大量录像数据,目前没有,也不着急。 4. 结语 无
|
|