摘要: 题目: 通过给出的驾驶员行为数据(trip.csv),对驾驶员不同时段的驾驶类型进行聚类,聚成普通驾驶类型,激进类型和超冷静型3类 。 利用Python的scikit-learn包中的Kmeans算法进行聚类算法的应用练习。并利用scikit-learn包中的PCA算法来对聚类后的数据进行降维,然后 阅读全文
posted @ 2017-06-29 13:35 fcyh 阅读(25979) 评论(51) 推荐(6) 编辑
摘要: Spark MLlib回归算法 线性回归、逻辑回归、SVM和ALS 1、线性回归: (1)模型的建立: 回归正则化方法(Lasso,Ridge和ElasticNet)在高维和数据集变量之间多重共线性情况下运行良好。 数学上,ElasticNet被定义为L1和L2正则化项的凸组合: 通过适当设置α,E 阅读全文
posted @ 2017-06-29 09:23 fcyh 阅读(1815) 评论(0) 推荐(0) 编辑