评委一评分,签名及备注队号:10302评委三评分,签名及备注评委二评分,签名及备注选题:A:2048评委四评分,签名及备注题目:基于 Monte Carlo 局面评估和 UCT 博弈树搜索的 2048摘要 本文首先提出 Random-Max-Trees 算法来实现人工智能的 2048
此算法是通过静态评估函数来求得最优解
不过在实现的过程中出现冗余的现象,当移动方格步数过多的时候,好的评估函数却很难找到,使 Random-Max-Trees 算法效率减少
随即本论文采用 Alpha-Beta 算法,是前者的一种改善,在搜索结点数同样的状况下,可以使搜索深度达到本来的两倍
在实现的过程中发现 Alpha-Beta 严重依赖于着法的寻找次序
只有当程序挑最佳的子节来当先搜索,才会靠近于实际分枝因子的平方根,也是该算法最佳的状态
不过在首先搜索最坏的子节时,Beta 截断不会发生,此时该算法就如同 Random-Max-Trees 同样,效率非常低,也失去 Alpha-Beta 的优势,也无法试图通过面的搜索来弥补方略上的局限性
本文采用蒙特卡洛评估对以上模型进行了改善
它通过对目前局面下的每个的可选点进行大量的模拟来得出对应的胜负的记录特性,在简单状况下,胜率较高的点就可以认为是很好的点予以选择
由于 UCT 算法能不停根据之前的成果调整方略,选择优先评估哪一种可下点
因此在蒙特卡洛德基础上运用 UCT 算法提高收敛速度
可求得概率为 100%
对于第二问,采用归纳法以及概率论量化数值,当方格为时,最大能达到,假如将方格扩展到个,能达到的最大数为
最终对模型进行评价
本论文算法是采用 JAVA、C++以及 MATLAB 实现
关键字:Random-Max-Trees;Alpha-beta;Monte Carlo;UTC;概率论基于 Monte Carlo 局面评估和 UCT