霄都不感冒。

    这就是收集傲世指数困难的地方。

    看来只有等成品问世,对他们才能收割一波。

    任务有坑啊。

    柯杰兴趣很浓:“那么问题在于,如何筛选出这样的点。”

    “所以,我们需要对算法进行加成。”元霄解释。

    围棋棋盘上的一个点,可以用数值表示它的状态。

    比如有白棋是1,有黑棋是-1,没有棋就是0。

    这是最基础的。

    如此一来,就可以对整个棋盘361个点,建立数学数值。

    然后,程序就可以对这群数值进行反复的运算。

    元霄画出一个概念图:“第一个我们需要的是,可以称为策略神经网络。”

    策略神经网络的作用,是判断当前局势下,下一步棋下在哪里最合适。

    元霄认为,这里的选点,可以参考人类棋手的棋谱。

    模仿人类棋手的思考模式,快速将一些低概率的点淘汰掉。

    柯杰叹了口气:“看来,到时候我还要提供目前为止所有人类的对局棋谱了。”

    理论上而言,棋谱数量越多,策略神经网络的成熟度也越高。

    “这一点,我们让计算机自主学习。”元霄指出其中的关键。

    反复推演学习的结果,将会使策略神经网络更加强大,选点更为准确。

    “而要做到这一步,还需要另外一个神经网络的结合。”元霄写下一个公式。

    价值神经网络。

    其作用是能够计算出,每个选点的胜率。

    每一步都进行这样的估值判断,直到棋局的结束,得到最精准的胜率数值。

    而同样,这东西也可以自己学习。

    总结起来其实很简单。

    就是模拟人类下棋的思维。

    首先判断在哪些地方可以下,每个地方的胜率是多少。

    然后对这些选点进行集中计算,推演出最后的结果。

    每一步都这么执行。

    那么得到的每一手,自然就-->>

章节列表 转码阅读中,不进行内容存储和复制