2025年MathorCup竞赛优秀论文基于MonteCarlo局面评估和UCT博弈树搜索的

下载本文档

阅读 145
下载 14
格式 doc
大小 3.96 MB
约36页
2025-04-09 发布于江苏
收藏
评论
点赞(0)
海报
举报

2025年MathorCup竞赛优秀论文基于MonteCarlo局面评估和UCT博弈树搜索的_第1页

1/36页

2025年MathorCup竞赛优秀论文基于MonteCarlo局面评估和UCT博弈树搜索的_第2页

2/36页

2025年MathorCup竞赛优秀论文基于MonteCarlo局面评估和UCT博弈树搜索的_第3页

3/36页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/36

文本预览下载提示常见问题

评委一评分，签名及备注队号：10302评委三评分，签名及备注评委二评分，签名及备注选题：A:2048评委四评分，签名及备注题目：基于 Monte Carlo 局面评估和 UCT 博弈树搜索的 2048摘要本文首先提出 Random-Max-Trees 算法来实现人工智能的 2048。此算法是通过静态评估函数来求得最优解。不过在实现的过程中出现冗余的现象，当移动方格步数过多的时候，好的评估函数却很难找到，使 Random-Max-Trees 算法效率减少。随即本论文采用 Alpha-Beta 算法，是前者的一种改善，在搜索结点数同样的状况下,可以使搜索深度达到本来的两倍。在实现的过程中发现 Alpha-Beta 严重依赖于着法的寻找次序。只有当程序挑最佳的子节来当先搜索，才会靠近于实际分枝因子的平方根，也是该算法最佳的状态。不过在首先搜索最坏的子节时，Beta 截断不会发生，此时该算法就如同 Random-Max-Trees 同样，效率非常低，也失去 Alpha-Beta 的优势，也无法试图通过面的搜索来弥补方略上的局限性。本文采用蒙特卡洛评估对以上模型进行了改善。它通过对目前局面下的每个的可选点进行大量的模拟来得出对应的胜负的记录特性，在简单状况下，胜率较高的点就可以认为是很好的点予以选择。由于 UCT 算法能不停根据之前的成果调整方略，选择优先评估哪一种可下点。因此在蒙特卡洛德基础上运用 UCT 算法提高收敛速度。可求得概率为 100%。对于第二问，采用归纳法以及概率论量化数值，当方格为时，最大能达到，假如将方格扩展到个，能达到的最大数为。最终对模型进行评价。本论文算法是采用 JAVA、C++以及 MATLAB 实现。关键字：Random-Max-Trees；Alpha-beta；Monte Carlo；UTC；概率论基于 Monte Carlo 局面评估和 UCT 博弈树搜索的 20481．问题提出2048 是近来一款非常火爆的益智游戏，诸多网友自称“一旦玩上它就主线停不下来”。2048 游戏的规则很简单：每次控制所有方块向同一种方向运动，两个相似数字的方块撞在一起之后合并成为他们的和，每次操作之后会在空白的方格处随机生成一种 2 或者 4，最终得到一种“2048”的方块就算胜利了。假如 16 个格子所有填满并且相邻的格子都不相似也就是无法移动的话，那么游戏就会结束。本文将建立数学模型，解答下列问题：1. 怎样才能达到 2048，给出一种通用的模型，并采用完毕游戏所需移动次数和成功概率两个指标来验证模型的有效性；2. 得到 2048 之后，游戏还可以继续玩，那么最大能达到多...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容