大二机器学习算法工程师实习生面经

投了近20家大厂,由于才大二,简历内容也不算丰富,所以大多数在简历关就挂了.得到笔试机会的有网易,今日头条,百词斩.

百词斩(一面挂)

一面:

  1. 平时如何学习相关知识.
  2. 项目经历.
  3. 讲一个最喜欢的机器学习算法.我答了神经网络.
  4. 为什么神经网络的激励函数要用非线性的.没有回答出来.正确答案是线性函数叠加仍是线性函数,非线性函数才能起到层与层之间的变化.
  5. 了解决策树吗,决策树划分结点的方法有哪些.
  6. 详细解释信息增益.
  7. 什么是过拟合?如何防止过拟合?
  8. 讲讲KNN和K-Means的不同.
  9. K-Means一般如何选取K值和初始质心.选取K值应该讲到平均轮廓系数,答得不好.
  10. 一般怎么做交叉验证.
  11. 百词斩题库中有很多阅读题,现在如何判断新出的题目和已有题目的相似度.我的回答是用词袋向量计算夹角余弦值.
  12. 有监督学习和无监督学习的区别是什么.

总共持续了半小时左右,面试官比较和蔼.由于恰好感冒所以问题回答的都不大好.

今日头条(二面挂)

一面:

  1. 手写代码:旋转有序数组的二分查找,磕磕绊绊写出来了
  2. 项目经历
  3. 了解哪些机器学习算法

二面:

  1. 项目经历
  2. 了解集成学习吗,讲讲bagging和boosting
  3. 随机森林
  4. GBDT
  5. 如果单棵决策树在数据集上的表现很差,还要尝试随机森林吗
  6. 知道哪些分类和回归的算法
  7. 分类和回归常用的损失函数
  8. 手写代码:有20000个词频,如何选出前100个高频词.因为正好看了堆排序就按堆排序的思路答了,但是面试官说20000其实是一个不大的数据量,直接用sort()排序就可以了.
  9. 手写代码:有两个二叉树节点,如何找到他们的最近公共子节点.因为对数据结构有些生疏,最后在面试官提示下才回答上来.

总结

不同公司侧重点很不一样,比如百词斩问了很多机器学习基础知识的问题,头条则很注重算法.共同点是项目经历非常重要.通过这次经历看出自己还是有很多知识漏洞的,接下来的学习重点是多参加比赛,多实践,还有了解常用的算法与数据结构.

posted @ 2018-04-08 22:07  Limitlessun  阅读(2847)  评论(2编辑  收藏  举报