打赏

Spark Mllib里决策树回归分析如何对numClasses无控制和将部分参数设置为variance(图文详解)

 

 

  不多说,直接上干货!

 

 

 

  在决策树二元或决策树多元分类参数设置中:

    使用DecisionTree.trainClassifier

      见

Spark Mllib里如何对决策树二元分类和决策树多元分类的分类数目numClasses控制(图文详解)

 

    val model = DecisionTree.trainClassifier(trainData, 2, Map[Int, Int](), impurity, maxDepth, maxBins)

 

 

 

 

 

 

 

  在决策树回归分析参数设置中:

  

  使用DecisionTree.trainRegressor,无numClasses参数,而且,这里是共有impurity, maxDepth, maxBins这3个参数。

  将impurity固定为variance

      见

Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第18章 决策树回归分类Bike Sharing数据集

 

posted @ 2017-09-01 16:30  大数据和AI躺过的坑  阅读(255)  评论(0编辑  收藏  举报