百度大搜 算法的实习
百度大搜 rank实习一面
面了2个小时,面到怀疑人生。
算法题:
- 手写快排
- .最长公共子串
懵逼的题:
- learn2rank
- 短串匹配:有一些短串,如 杨幂 刘翔 (几万),还有很多query(几亿),比如刘翔夺冠(命中),刘夺冠(没命中),删除没命中的query。
字典树+KMP字符串匹配(ac自动机)
将 几万短串 构建一颗trie树,然后依次将query进行多模匹配(ac自动机)
- 点击率特征如何设计?
clicks/views
需要注意 1/1 这种点击率为1的情况,如果view很小的话,可能点击率比较大,比如说1个人看到了1个人点击,点击率是100%。
背诵题:
- 特征选择方法?
- CNN RNN区别?
- TFIDF?
- LR GBDT特征注意事项?
归一化,缺失值,onehot
- 深度学习避免过拟合?
dropout BN .L1 L2
贴几个别人的面经,没答上来的题竟然在别人面经里!!!
https://www.cnblogs.com/qscqesze/p/6509450.html
https://blog.csdn.net/hopeztm/article/details/7818775
https://blog.csdn.net/koudaidai/article/details/7620190
百度大搜 网页搜索部一面
20180509
图片搜索应该 挂了,今天又面了个网页搜索部,估计也是挂。。。
自我介绍。问我NLP是怎么学的?研究方向是啥,导师啥的
2道算法题
1、判断链表是否回文
2 剑指第一题
题目不难,自己答得太烂了, 回文那个链表逆转没写好,奇偶也没判断。
第二题思路是对的,但是不是面试官想要的答案,面试官也一直想说我的思路是错的,结果就gg
总结:之前面的算法题都没有思路,现在有思路了却写不出来,真的不能背题,怎也也得自己手写一遍,最好是在纸上画画,另外写代码的时候可以一遍写一遍讲讲?
百度核心搜索部
一面:
项目介绍
GBDT树特征重要性如何计算
learn2rank point wise par wise 区别
c++ static 关键字
算法题:
无序数组找出中位数
对只含1-n的n数组排序。
一面面试官超级好,会不断的提醒你,
二面:
L1 L2正则化区别,应用场景
树模型如何控制过拟合
树模型调参经验
二面答得不是很好,会冷场哦。
PS:他们主要做leran2rank 深度学习传统学习都会用。