2018 年 6月 12 日随笔档案 - 小学森也要学编程

2018年6月12日

摘要：参数： n : int 数据集中的元素总数。 n_iter : int (default 10) 重新洗牌和分裂迭代次数。 test_size : float (default 0.1), int, or None 如果是float类型的数据, 这个数应该介于0-1.0之间，代表test集所占比例. 阅读全文

posted @ 2018-06-12 23:58 小学森也要学编程阅读(1943) 评论(0) 推荐(0) 编辑

sklearn 中 make_blobs模块

摘要：参数 n_samples: int, optional (default=100) 待生成的样本的总数。 n_features: int, optional (default=2) 每个样本的特征数。 centers: int or array of shape [n_centers, n_feat 阅读全文

posted @ 2018-06-12 23:52 小学森也要学编程阅读(700) 评论(0) 推荐(0) 编辑

随机森林（Random Forest）

摘要： 1.什么是随机森林简述随机森林是一个高度灵活的机器学习方法，拥有广泛的应用前景，从市场营销到医疗保健保险。既可以用来做市场营销模拟的建模，统计客户来源，保留和流失。也可用来预测疾病的风险和病患者的易感性。随机森林是一个可做能够回归和分类。它具备处理大数据的特性，而且它有助于估计或变量是非常阅读全文

posted @ 2018-06-12 23:47 小学森也要学编程阅读(9525) 评论(0) 推荐(0) 编辑

iris数据集

摘要： python iris 数据集 sklearn中的iris数据集有5个key： [‘target_names’, ‘data’, ‘target’, ‘DESCR’, ‘feature_names’] target_names : 分类名称 [‘setosa’ ‘versicolor’ ‘virgi 阅读全文

posted @ 2018-06-12 21:19 小学森也要学编程阅读(854) 评论(0) 推荐(0) 编辑