2018年6月12日
摘要: 参数: n : int 数据集中的元素总数。 n_iter : int (default 10) 重新洗牌和分裂迭代次数。 test_size : float (default 0.1), int, or None 如果是float类型的数据, 这个数应该介于0-1.0之间,代表test集所占比例. 阅读全文
posted @ 2018-06-12 23:58 小学森也要学编程 阅读(1943) 评论(0) 推荐(0) 编辑
摘要: 参数 n_samples: int, optional (default=100) 待生成的样本的总数。 n_features: int, optional (default=2) 每个样本的特征数。 centers: int or array of shape [n_centers, n_feat 阅读全文
posted @ 2018-06-12 23:52 小学森也要学编程 阅读(700) 评论(0) 推荐(0) 编辑
摘要: 1.什么是随机森林 简述 随机森林是一个高度灵活的机器学习方法,拥有广泛的应用前景,从市场营销到医疗保健保险。 既可以用来做市场营销模拟的建模,统计客户来源,保留和流失。也可用来预测疾病的风险和病患者的易感性。 随机森林是一个可做能够回归和分类。 它具备处理大数据的特性,而且它有助于估计或变量是非常 阅读全文
posted @ 2018-06-12 23:47 小学森也要学编程 阅读(9525) 评论(0) 推荐(0) 编辑
摘要: python iris 数据集 sklearn中的iris数据集有5个key: [‘target_names’, ‘data’, ‘target’, ‘DESCR’, ‘feature_names’] target_names : 分类名称 [‘setosa’ ‘versicolor’ ‘virgi 阅读全文
posted @ 2018-06-12 21:19 小学森也要学编程 阅读(854) 评论(0) 推荐(0) 编辑