todo提纲
deep&wide为啥work,如何优化特征;详述attention,attention在ctr预估中如何使用,din为啥work?详述transformer,如何应用于ctr预估;item2vec为啥work,如何优化?dssm的原理,如何应用推荐系统中?推荐系统的流量分层如何优化?强化学习如何用于推荐系统,是否了解业界rl的进展? nn为什么work,它是怎么解决逻辑或和逻辑与的问题的;sigmoid和tanh之间的区别,zigzag问题如何解决;relu遇到神经元坏死如何解决;bn大法为啥好,有几种方法,局限性和改进方案;adam为啥常用;dropout为啥work;详述cnn的反向传播和rnn的bptt;