摘要: 1.调整模型参数来提高性能 参数调整:调节模型合适的选项的过程,如股票C5.0决策树模型中的trials参数,神经网络中的调节节点、隐层数目,SVM中的核函数等等。 caret包自动调整参数:train函数,为分类和回归的150种不同机器学习模型自动搜寻一个最优的模型。支持的模型及相关可调节参数的详 阅读全文
posted @ 2020-09-11 21:23 生物信息与育种 阅读(2385) 评论(1) 推荐(0) 编辑
摘要: 1.评估分类方法的性能 拥有能够度量实用性而不是原始准确度的模型性能评价方法是至关重要的。 3种数据类型评价分类器:真实的分类值;预测的分类值;预测的估计概率。之前的分类算法案例只用了前2种。 对于单一预测类别,可将predict函数设定为class类型,如果要得到预测的概率,可设为为prob、po 阅读全文
posted @ 2020-09-11 16:27 生物信息与育种 阅读(4816) 评论(0) 推荐(0) 编辑
摘要: 1.理解Kmeans聚类 1)基本概念 聚类:无监督分类,对无标签案例进行分类。 半监督学习:从无标签的数据入手,是哦那个聚类来创建分类标签,然后用一个有监督的学习算法(如决策树)来寻找这些类中最重要的预测指标。 kmeans聚类算法特点: kmeans算法涉及将n个案例中的每一个案例分配到指定k个 阅读全文
posted @ 2020-09-11 09:59 生物信息与育种 阅读(2730) 评论(0) 推荐(0) 编辑