上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 39 下一页
摘要: 解决方法 把 samples_generator 改成 _samples_generator import sklearn.datasets._samples_generator import make_blobs 阅读全文
posted @ 2021-09-24 17:10 Trouvaille_fighting 阅读(467) 评论(0) 推荐(0)
摘要: 1 boosting集成原理 1.1 什么是boosting 随着学习的积累从弱到强,每新加入一个弱学习器,整体能力就会得到提升。 代表算法:Adaboost,GBDT,XGBoost 1.2 实现过程 1.训练第一个学习器 2.调整数据分布 3.训练第二个学习器 4.再次调整数据分布 5.依次训练 阅读全文
posted @ 2021-09-24 15:35 Trouvaille_fighting 阅读(142) 评论(0) 推荐(0)
摘要: 1 Bagging集成原理 目标:把下面的圈和方块进行分类 实现过程: 1.采样不同数据集 2.训练分类器 3.平权投票,获取最终结果 4.主要实现过程小结 2 随机森林构造过程 随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。 随机森林 =Bagging + 阅读全文
posted @ 2021-09-24 11:29 Trouvaille_fighting 阅读(98) 评论(0) 推荐(0)
摘要: 1 什么是集成学习 集成学习通过建立几个模型来解决单一预测问题。 工作原理是生成多个分类器/模型,各自独立地学习和作出预测。 最后结合成组合预测,得到优于任何一个单分类的预测。 2 机器学习的两个核心任务 如何优化训练数据 —> 主要用于解决欠拟合问题 如何提升泛化性能 —> 主要用于解决过拟合问题 阅读全文
posted @ 2021-09-24 11:08 Trouvaille_fighting 阅读(182) 评论(0) 推荐(0)
摘要: 1 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管 阅读全文
posted @ 2021-09-23 21:29 Trouvaille_fighting 阅读(1130) 评论(0) 推荐(0)
摘要: 决策树算法api class sklearn.tree.DecisionTreeClassifier(criterion='gini', max_depth=None,random_state=None) criterion 特征选择标准 "gini"或者"entropy",前者代表基尼系数,后者代 阅读全文
posted @ 2021-09-23 20:46 Trouvaille_fighting 阅读(102) 评论(0) 推荐(0)
摘要: 特征提取【了解】 将任意数据(如文本或图像)转换为可用于机器学习的数字特征 特征提取分类:【了解】 字典特征提取(特征离散化) 文本特征提取 图像特征提取 字典特征提取【知道】 字典特征提取就是对类别型数据进行转换 api:sklearn.feature_extraction.DictVectori 阅读全文
posted @ 2021-09-23 20:37 Trouvaille_fighting 阅读(175) 评论(0) 推荐(0)
摘要: 1 文本特征提取 作用:对文本数据进行特征值化 1、sklearn.feature_extraction.text.CountVectorizer(stop_words=[]) 返回词频矩阵 CountVectorizer.fit_transform(X) X:文本或者包含文本字符串的可迭代对象 返 阅读全文
posted @ 2021-09-23 20:31 Trouvaille_fighting 阅读(427) 评论(0) 推荐(0)
摘要: 1 特征提取 1.1 定义 将任意数据(如文本或图像)转换为可用于机器学习的数字特征 注:特征值化是为了计算机更好的去理解数据 特征提取分类 字典特征提取(特征离散化) 文本特征提取 图像特征提取 1.2 特征提取API sklearn.feature_extraction 2 字典特征提取 作用: 阅读全文
posted @ 2021-09-23 19:33 Trouvaille_fighting 阅读(374) 评论(0) 推荐(0)
摘要: 1 为什么要剪枝 1.1 图形描述 横轴表示在决策树创建过程中树的结点总数 纵轴表示决策树的预测精度 实线显示的是决策树在训练集上的精度 虚线显示的则是在一个独立的测试集上测量出来的精度 随着树的增长,在训练样集上的精度是单调上升的, 然而在独立的测试样例上测出的精度先上升后下降。 1.2 出现这种 阅读全文
posted @ 2021-09-23 19:08 Trouvaille_fighting 阅读(139) 评论(0) 推荐(0)
上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 39 下一页