百度nlp实习生转岗(猝)

 

 一面:

大部分是问项目相关的。只记住了几个关键的问题。

 

1、手写快排

2、生成模型与判别模型的区别

 

分类问题:2种形式:

F(x)=y

p(y|x)

 

生成模型:由数据学习联合分布概率p(x,y),然后求出条件概率分布p(y|x)

p(y|x) = p(x,y)/p(x)

例如,朴素贝叶斯。

判别模型:

直接学习p(y|x),不用联合分布概率。

3、svm 核函数作用?

   解决线性不可分问题,减少计算量。

 

4、你的专业是通信工程,通信是做什么的?

5、通信工程中有哪些机器学习的知识?

6、聊比赛,360人机写作识别中,如何识别将相同的主题文章随机段落拼接起来,

这种文章如何识别?

困惑度;训练模型,正常文章当正样本,人为拼接一些文章做负样本训练;

将每段 单独摘出来去互联网上找这篇文章,看是否撞库。

Ps.没想到这个比赛在实际中还很有用,关于如何检测文章是否是机器拼接,

识别机器写的垃圾文章。

7、深度学习seq2seq了解多少?

 

后记:

这个是nlp对话相关的组,据说很多人想进,而且也比较难进,上来让我带着电脑过去撸代码,主要工作是论文调研,还挺想去这个的,不知道二面会咋样,二面面试官是牛老师面,内网搜了搜,感觉好厉害。加油吧。

 二面:

基本上都是介绍项目

用10分钟介绍一下实习的项目

用5分钟介绍一下比赛的项目

 

算法题:

用定长数组实现队列的入队出队操作。

posted @ 2018-02-27 21:01  乐乐章  阅读(299)  评论(0编辑  收藏  举报