134. 给你们来一个七定王-《重生之AI教父》


    第(2/3)页

    从理论上来说,围棋问题的输入和孟繁岐非常擅长的图像类其实很像。

    彩色图片在计算机中的形式就是多通道矩阵,通常为3通道,代表三原色。

    比如,一张分辨率为224x224的图片,就是以三个[224, 224]矩阵的形式进行存储。

    一般来说,每个位置的取值在0~255之间。

    对于围棋这个情况来说,它的输入就像是一个19x19的单通道图片。

    19x19表示棋盘上所有的落子地点,而每个地点的取值就只有三种状态,黑,白,无子。

    可以用[-1,0,1]三个数字来指代。

    而围棋智能的目标,所谓的下棋。

    如果不考虑其中原理的话,它的外在反馈其实就是给定这样一个[19,19]的棋盘,希望程序可以在上面仅改变一个无子的数字0到给定的棋子类型(数字-1或者1),同时使得该方获胜的概率尽可能地变大。

    “棋盘就是一副黑白的单通道分辨率为19的图像。”这个事情在普通人看来比较不会想到。

    不过对于比较熟悉图像技术和深度神经网络的孟繁岐来说,是很自然的事情和概念。

    “我们从深度神经网络的突破中获得了灵感,在2012年底的AlexNet之前,疯狂石头这款围棋智能提供的准确率是最高的,达到35%左右。

    目前主要是在研究,如何使用深度神经网络使得围棋智能的判断更加精准。

    Alex和你引领的深度神经网络在分类问题上有了惊人的突破,这是我们今年启动这个项目的一大原因。

    我们目前在尝试收集大量的专业对弈棋谱,目前已经有了十多万场比赛的内容。而从这十万多场比赛当中,又可以抽离出上百万个单次落子。

    通过这个数据,我们现阶段在确立合适的网络结构,在这个方面,我想你是专家中的专家。”

    “我大概了解了。”孟繁岐听完之后基本明白了DeepMind现阶段的想法和进展情况。

    虽然此前黄博士在围棋AI项目上有过很多研究,但阿尔法围棋项目毕竟才刚刚开始,同时也是基于全新的深度网络技术。

    目前为止,他们还没有形成一整套的学习以及对抗的思路,那一套策略网络-评估网络-强化学习-蒙特卡洛搜索的总体结构还没有成型。

    还停留在比较早期的阶段,甚至还没有最后决定到底使用怎样的网络结构比较好,此时正在对模型本身的结构进行测试和设计。

    “这方面确实是我比较擅长的方向,尤其最近,我在CPU和小模型的设计上有一些想法,这些内容应该会对你们有一定的帮助。”
    第(2/3)页