围棋吧 关注:346,610贴子:10,424,284
  • 11回复贴,共1

为何leelaz的网络不是旋转对称的?

只看楼主收藏回复

用目前最新网络
leelaz.exe -g --noponder -w leelaz-model-3486475-64000.txt
执行 heatmap,输出结果为
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 25 0 0 0 0 0 0 0 0 0 0 0 25 0 0 0
0 0 34 169 0 0 0 0 0 0 0 0 0 0 0 191 30 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 31 151 0 0 0 0 0 0 0 0 0 0 0 176 30 0 0
0 0 1 24 0 0 0 0 0 0 0 0 0 0 0 26 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
pass: 0
winrate: 0.495564
明显策略网络不是旋转对称不变的。
可为什么?难道是输入数据没有经过对称化(即将1盘棋变成8盘棋)?
如果确实如此,难道作者想要让程序自己学会对称性?这一点重要吗?
关键是,很浪费啊。。。


1楼2018-02-06 16:02回复
    这就叫纯粹主义、完美主义


    2楼2018-02-06 16:08
    收起回复
      会用旋转后的棋盘做训练数据,不过训练过程是随机的,网络可能在一个方位学到一种知识,在另一个方位学到另一种知识。希望最后能收敛到比较对称的状态


      IP属地:美国来自Android客户端4楼2018-03-21 07:31
      收起回复
        黄博士说,采用旋转对称数据,相当于把训练量提高四倍。


        IP属地:浙江5楼2018-03-21 09:27
        回复
          LZ在下棋和训练的时候都已经利用了对称性,所以一楼担心的问题不存在。
          详情见273号issue。


          IP属地:海南6楼2018-03-21 10:46
          回复
            为什么要对称,对称就失去随机性了


            IP属地:美国来自手机贴吧7楼2018-03-22 11:09
            回复