摘要: #调用查看线性回归的几个属性 # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/pythontutorial """ Please note, this code is only for pyt... 阅读全文
posted @ 2018-11-15 15:38 simpleDi 阅读(429) 评论(0) 推荐(0) 编辑
摘要: # View more python learning tutorial on my Youtube and Youku channel!!! # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/... 阅读全文
posted @ 2018-11-15 15:34 simpleDi 阅读(1623) 评论(0) 推荐(0) 编辑
摘要: # View more python learning tutorial on my Youtube and Youku channel!!! # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/... 阅读全文
posted @ 2018-11-15 15:33 simpleDi 阅读(1451) 评论(0) 推荐(0) 编辑
摘要: 一、机器学习算法分类: 监督学习:提供数据和数据分类标签。——分类、回归 非监督学习:只提供数据,不提供标签。 半监督学习 强化学习:尝试各种手段,自己去适应环境和规则。总结经验利用反馈,不断提高算法质量 遗传算法:淘汰弱者,留下强者,进行繁衍和变异穿产生更好的算法。 二、选择机器学习算法和数据集 阅读全文
posted @ 2018-11-14 22:00 simpleDi 阅读(1543) 评论(0) 推荐(0) 编辑
摘要: 安装matplotlib和seaborn https://blog.csdn.net/Jia_jinjin/article/details/80428598 seaborn pairplot:特征两两对比 参数说明: data:数据。 g = sns.pairplot(data) hue:根据指定的 阅读全文
posted @ 2018-11-12 22:09 simpleDi 阅读(2227) 评论(1) 推荐(2) 编辑
摘要: 敲《Python机器学习及实践》上的code的时候,对于数据预处理中涉及到的fit_transform()函数和transform()函数之间的区别很模糊,查阅了很多资料,这里整理一下: 涉及到这两个函数的代码如下: 我们先来看一下这两个函数的API以及参数含义:1、fit_transform()函 阅读全文
posted @ 2018-11-12 21:39 simpleDi 阅读(4549) 评论(0) 推荐(0) 编辑
摘要: 一、特征选择方法分类 1、特征选择也是对数据进行预处理的一个步骤,在进行特征选择的时候我们有以下两个原则,即指导方向: 特征是否发散:如果一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上没有差异,这个特征对于样本的区分并没有什么用。 特征与目标的相关性:这点比较显见,与目标相关性高的 阅读全文
posted @ 2018-11-08 11:24 simpleDi 阅读(1732) 评论(0) 推荐(0) 编辑
摘要: 1、matplotlib.pyplot 2、sklearn 是一个python中的机器学习库,寂静基本实现了所有机器学习的算法。 3、StratifiedKFold 参考链接:https://blog.csdn.net/u012735708/article/details/82258615 Stra 阅读全文
posted @ 2018-11-07 14:44 simpleDi 阅读(2142) 评论(0) 推荐(0) 编辑
摘要: 参考文献:https://baijiahao.baidu.com/s?id=1609320767556598767&wfr=spider&for=pc 三者都是对数据进行预处理的方式。 标准化(Standardization) 归一化(normalization) 正则化(regularizatio 阅读全文
posted @ 2018-11-06 21:25 simpleDi 阅读(10859) 评论(0) 推荐(0) 编辑
摘要: 一、简介 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法,pandas为时间序列分析提供了很好的支持。 二、数据结构 阅读全文
posted @ 2018-11-05 10:58 simpleDi 阅读(1260) 评论(0) 推荐(0) 编辑