常见问题记录

1、为什么分类问题不能使用mse损失函数

https://my.oschina.net/mathinside/blog/4537752

https://blog.csdn.net/u011913417/article/details/106358095

https://www.zhihu.com/question/314185485

 

2、如何理解双塔模型中cosine similarity的计算?如何理解粗排和精排的不同需求?

 

3、L1范数和L2范数各自的用处?Batch Nornalization有什么好处,为什么要使用,记得公式吗?

4、如何防止梯度爆炸和梯度消失,如何理解RNN与LSTM的差别?

 

posted @ 2021-03-04 17:15  合唱团abc  阅读(68)  评论(0编辑  收藏  举报