随笔- 200  文章- 29  评论- 16  阅读- 39万 
12 2018 档案
特征选择
摘要:现有的特征选择算法,从不同的角度,可以分为不同的类型。按数据标签的获取情况,可以分为有监督、半监督和无监督特征选择;按是否需要额外的学习算法参与特征选择过程,以及具体的参与方式,可以分为封装型(wrapper)、嵌入式(embedded)和过滤型(filter)。再细致一些,可以分为基于信息论的特征 阅读全文
posted @ 2018-12-21 14:45 大雄fcl 阅读(393) 评论(0) 推荐(0) 编辑
python 数据分析--pandas
摘要:接下来pandas介绍中将学习到如下8块内容:1、数据结构简介:DataFrame和Series2、数据索引index3、利用pandas查询数据4、利用pandas的DataFrames进行统计分析5、利用pandas实现SQL操作6、利用pandas进行缺失值的处理7、利用pandas实现Exc 阅读全文
posted @ 2018-12-20 11:35 大雄fcl 阅读(487) 评论(0) 推荐(0) 编辑
三大统计相关系数:Pearson、Spearman秩相关系数、kendall等级相关系数
摘要:统计相关系数简介 由于使用的统计相关系数比较频繁,所以这里就利用几篇文章简单介绍一下这些系数。 相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。 如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解: (1)、当相关系数为0时,X和Y两变量无关系。 (2)、当X的值增大( 阅读全文
posted @ 2018-12-19 16:59 大雄fcl 阅读(8213) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示