摘要: 1.数据标准化-StandardScaler ​ 引用维基百科一句话,在统计学领域,标准化指的是向标准得分的转换 ​ 在数据量大小差别很大,而且具有不同的量纲时,如果直接用原始数值进行分析,就会感觉数值较高的相对较低的作用更突出。所以,为了保证结果的可靠性,需要对原始数据进行标准化处理。 数据标准化 阅读全文
posted @ 2021-10-19 22:06 Rosaany 阅读(817) 评论(0) 推荐(0) 编辑
摘要: 1.处理缺失值方法 在pandas中,将缺失值称为NA,意思是not available(不可用) pandas在处理缺失值时,我们先了解相关函数介绍。 NA处理方法: 函数名 描述 dropna 根据每个标签的值是否是缺失数据来筛选轴标签,并根据允许丢失的数据量来确定阈值 fillna 用某些值填 阅读全文
posted @ 2021-10-19 19:11 Rosaany 阅读(596) 评论(0) 推荐(0) 编辑
摘要: 1.原理 ​ 逻辑回归(Logistic Regression,简称LR),它是一种评估事件发生概率的分类模型。线性回归与逻辑回归统称为广义线性模型,但普通的线性回归模型不能解决分类问题。逻辑回归模型是一种对数性模型,能够用于计算二分类问题。 ​ 前提假设是样本符合伯努利分布。在逻辑回归模型里面,应 阅读全文
posted @ 2021-10-19 11:19 Rosaany 阅读(305) 评论(0) 推荐(0) 编辑