百度nlp实习生转岗(猝)
一面:
大部分是问项目相关的。只记住了几个关键的问题。
1、手写快排
2、生成模型与判别模型的区别
分类问题:2种形式:
F(x)=y
p(y|x)
生成模型:由数据学习联合分布概率p(x,y),然后求出条件概率分布p(y|x)
p(y|x) = p(x,y)/p(x)
例如,朴素贝叶斯。
判别模型:
直接学习p(y|x),不用联合分布概率。
3、svm 核函数作用?
解决线性不可分问题,减少计算量。
4、你的专业是通信工程,通信是做什么的?
5、通信工程中有哪些机器学习的知识?
6、聊比赛,360人机写作识别中,如何识别将相同的主题文章随机段落拼接起来,
这种文章如何识别?
困惑度;训练模型,正常文章当正样本,人为拼接一些文章做负样本训练;
将每段 单独摘出来去互联网上找这篇文章,看是否撞库。
Ps.没想到这个比赛在实际中还很有用,关于如何检测文章是否是机器拼接,
识别机器写的垃圾文章。
7、深度学习seq2seq了解多少?
后记:
这个是nlp对话相关的组,据说很多人想进,而且也比较难进,上来让我带着电脑过去撸代码,主要工作是论文调研,还挺想去这个的,不知道二面会咋样,二面面试官是牛老师面,内网搜了搜,感觉好厉害。加油吧。
二面:
基本上都是介绍项目
用10分钟介绍一下实习的项目
用5分钟介绍一下比赛的项目
算法题:
用定长数组实现队列的入队出队操作。