星阵围棋董事长金涬博士致词,介绍了星阵围棋的特点以及公司未来的在围棋行业里的愿景。
AlphaGo是目前世界上最强的围棋程序,尤其是第二篇的AlphaGo Zero的论文,通过强化学习技术,把围棋人工智能的水平提高到相当高的水平,但这种算法消耗资源量空前巨大。需要2000个TPU自我对弈,每个每小时租金6.5美金,每天就是31万美金……这对很多研究围棋人工智能的团队来说是个天文数字,有些就终止了研发。
我们认为再消耗这么大的资源去验证一个已经被证明的算法,没有太多技术价值,所以选择了另外一条路。我们在特征体系、模型结构和MCTS算法架构,已经取得了一些初步的成果,可以认为是对Alphago向前的技术演进。我们的研究希望能够降低训练的资源需求量,完成模型学习,更有价值的是,通过我们的创新,能够下出不一样的围棋。有些团队一味跟进AlphaGo的论文,但架构和风格都相似,最后下出来的围棋也是大同小异。
我们想下出:优势下不退让的围棋,贴任意目数的围棋,下出任意棋盘路数的围棋,九路,十三路,甚至是十八路,二十路。这些工作其实已经超越了AlphaGo的架构。AlphaGo虽然功成身退了,但围棋的奥秘远远没有解开,围棋人工智能的创新和探索也不会停止。我们新的算法在围棋人工智能实验成熟后,希望能够迁移到其他体系,并有很强的实用性。
AlphaGo是目前世界上最强的围棋程序,尤其是第二篇的AlphaGo Zero的论文,通过强化学习技术,把围棋人工智能的水平提高到相当高的水平,但这种算法消耗资源量空前巨大。需要2000个TPU自我对弈,每个每小时租金6.5美金,每天就是31万美金……这对很多研究围棋人工智能的团队来说是个天文数字,有些就终止了研发。
我们认为再消耗这么大的资源去验证一个已经被证明的算法,没有太多技术价值,所以选择了另外一条路。我们在特征体系、模型结构和MCTS算法架构,已经取得了一些初步的成果,可以认为是对Alphago向前的技术演进。我们的研究希望能够降低训练的资源需求量,完成模型学习,更有价值的是,通过我们的创新,能够下出不一样的围棋。有些团队一味跟进AlphaGo的论文,但架构和风格都相似,最后下出来的围棋也是大同小异。
我们想下出:优势下不退让的围棋,贴任意目数的围棋,下出任意棋盘路数的围棋,九路,十三路,甚至是十八路,二十路。这些工作其实已经超越了AlphaGo的架构。AlphaGo虽然功成身退了,但围棋的奥秘远远没有解开,围棋人工智能的创新和探索也不会停止。我们新的算法在围棋人工智能实验成熟后,希望能够迁移到其他体系,并有很强的实用性。