2013年9月26日

百度NLP二面-电话面

摘要: 实验室项目:1.实验室方向 2.用两分钟介绍自己的项目,创新点在哪里个人项目: 1.自己实现的贝叶斯分类器,目的,怎么做的 2.怎么计算各个分类的先验。(因为我使用的训练预料是每个分类10篇,没有分类的先验) 3 每个主题有10篇文档,假设有1W篇文档,如何分到不同的主题中(我答的是计算与每个文档中其它文章的相似度,每个doc用一个term数组来表示,数组中每位表示的是这个文档中该单词 出现的个数(过滤掉停用词), 面试官提示会有漏掉的停用词,我说用出现的次数除于TF, 面试官说这就是TF-IDF)算法: 1.STL中set怎么实现的,假设有... 阅读全文

posted @ 2013-09-26 15:26 iamccme 阅读(1243) 评论(0) 推荐(0) 编辑

导航