携程数据分析一面面经

1.自我介绍

2.RFM模型是怎么定义的,包括各个分解值怎么选择的

3.窗口函数row_number

4.客户流失预警是什么样的项目,KNN是什么,SVM是什么,动态规划是什么,KNN中的k是什么?

kNN 的算法就是:

  • 在已知的 data points 中,逐一点检视(把這每一點叫作 P):
  • 首先计算「?」和 P 之间的距离
  • 所有距离计算之后,将他们由小至大 sort 好
  • 从 sort 好的序列,取最前的 k 个(即距离最接近「?」的 k 个点子)
  • 对这 k 个点,读出他们的 label(颜色)是什么,这是问题中已经知道的
  • 所有这些 labels(颜色),哪个出现最多?  (亦即是说,最接近「?」的 k 个点子,它们最普遍是什么颜色?)
  • 这出现次数最多的颜色,就是答案

动态规划为什么比暴力枚举快,原因是动态规划把问题拆解为一个个小问题先解决这些小问题,并把这些小问题的结果保存下来,后面需要的时候直接使用。

5.6个红球一个白球排成一排,有多少种排列组合?要是两个白球呢?

6.List和array的区别,为什么list可以存储多种数据?

因为list存储的是指针,是地址,所以可以存储多种数据。

posted @ 2021-03-09 17:36  薄荷味的糖  阅读(300)  评论(0编辑  收藏  举报