阅读记录

第181章 围棋软件的工作原理[2/2页]

我有一个全时空英灵系统 明镜不止水

设置 ×

  • 阅读主题
  • 字体大小A-默认A+
  • 字体颜色
压缩计算的范围和量,从而让程序能够顺利进行下去。
     柯杰点头:“概念的置换,得到当前局面的最优解,而不是整盘棋的最终解。”
     这两者是天差地别的。
     但是,只要从开始,计算机下的每一部,都是当前的最优解,累积起来,也就成了整盘棋的最优解。
     ?傲世指数+8888
     看看,这随便弄几下,就把柯杰给震出惊了。
     可惜的是,学生们大部分对元霄都不感冒。
     这就是收集傲世指数困难的地方。
     看来只有等成品问世,对他们才能收割一波。
     任务有坑啊。
     柯杰兴趣很浓:“那么问题在于,如何筛选出这样的点。”
     “所以,我们需要对算法进行加成。”元霄解释。
     围棋棋盘上的一个点,可以用数值表示它的状态。
     比如有白棋是1,有黑棋是1,没有棋就是0。
     这是最基础的。
     如此一来,就可以对整个棋盘361个点,建立数学数值。
     然后,程序就可以对这群数值进行反复的运算。
     元霄画出一个概念图:“第一个我们需要的是,可以称为策略神经网络。”
     策略神经网络的作用,是判断当前局势下,下一步棋下在哪里最合适。
     元霄认为,这里的选点,可以参考人类棋手的棋谱。
     模仿人类棋手的思考模式,快速将一些低概率的点淘汰掉。
     柯杰叹了口气:“看来,到时候我还要提供目前为止所有人类的对局棋谱了。”
     理论上而言,棋谱数量越多,策略神经网络的成熟度也越高。
    本小章还未完,请点击下一页继续阅读后面精彩内容!
     “这一点,我们让计算机自主学习。”元霄指出其中的关键。
     反复推演学习的结果,将会使策略神经网络更加强大,选点更为准确。
     “而要做到这一步,还需要另外一个神经网络的结合。”元霄写下一个公式。
     价值神经网络。
     其作用是能够计算出,每个选点的胜率。
     每一步都进行这样的估值判断,直到棋局的结束,得到最精准的胜率数值。
     而同样,这东西也可以自己学习。
     总结起来其实很简单。
     就是模拟人类下棋的思维。
     首先判断在哪些地方可以下,每个地方的胜率是多少。
     然后对这些选点进行集中计算,推演出最后的结果。
     每一步都这么执行。
     那么得到的每一手,自然就是最佳的下法。
     如果说一开始柯杰觉得元霄说的是天方夜谭。
     到了现在,他感觉这东西并不是完全不可能实现的了。
     他咽下口水:“如此一来的话,那不是一开始的时候,计算机就已经锁定了结果。”
     必胜的结果。
     ?傲世指数+8888
     “这只是大概的概念,实际我们还需要一步步来,”元霄放下笔,“柯院长,到时候和围棋软件的对弈,还需要你来。”
     柯杰表示责无旁贷。
     苏辰逸、卓越、方旭尧几个都听懂了。
     夏晚晴黎沐岚之流,当然是不知所云。
     尤其是夏晚晴,她表示很鄙视。
     花脑袋去开发这玩意有啥用。
     老师也真是的,有时间和我一起不香么。
     计算机的世界,果然蕴含宅的属性。
    喜欢。
  

第181章 围棋软件的工作原理[2/2页]