1、矩阵和求导,要会自己算bp;为什么现在激活函数都用relu而不是s型?2、信号学。卷积层的数学意义是什么?为何图像经过cnn可以获取到语义特征?3、统计。什么是线性拟合?fc(特殊的convlayer,也有叫innerproduct)层的数学和物理意义是什么?为什么加了bn层收敛会加快?不加又是为什么?网络每层选用的初始化为什么有的是常数,有的却是使用了不同方差的高斯分布?4、做落地需要大量的code经验。5、cuda编程。6、数学感觉。如何对一个问题更有效的建模?。如何选择loss func?7、我没做过nlp,对它有限的了解是序列建模rnn很有用,也有bag of word方法。待大神补充。