大三寒假学习进度笔记(二十二)—— 降维与SparkSQL
写在前面
今天主要学习了机器学习部分的降维,完成了SparkSQL的学习
机器学习部分
今天主要学习了降维的概念,在机器学习中,我们有时候会遇到纬度很高的情况,对我们的计算和使用带来了很多问题,这时候我们就可以通过一些算法对他进行降维处理,从而达到不怎么损失精度又能解决问题的情况。主要介绍了PCA等
SparkSQL
完成了SparkSQL中的自定义UDF和自定义UDAF的学习
总结
明天学习SparkStreaming以及机器学习十讲的后续学习