摘要: 提取方差大于阀值的特征数据VarianceThreshold https://blog.csdn.net/weixin_42575020/article/details/82887014 假设某特征的特征值只有0和1,并且在所有输入样本中,95%的实例的该特征取值都是1,那就可以认为这个特征作用不大 阅读全文
posted @ 2019-12-28 17:53 数之美 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 真理之言 特征工程决定了机器学习的上限,而算法和模型只是逼近这个上限。 特征工程是什么 模型设计、算法训练之前的所有针对数据的准备工作,都称之为特征工程。 特征工程包含哪些工作 分析任务、获取数据、特征数据处理-异常值、空值、重复值、标准化等、特征处理-衍化、二值化、哑编码、降维等。这个过程中很多环 阅读全文
posted @ 2019-12-28 17:52 数之美 阅读(587) 评论(0) 推荐(0) 编辑
摘要: 代码部分: # -*- coding: utf-8 -*- import numpy as np import xlrd path="C:/Users/Desktop/temp/aprotest/2creatmodel/123.xlsx" data = xlrd.open_workbook(path 阅读全文
posted @ 2019-12-28 17:46 数之美 阅读(623) 评论(0) 推荐(0) 编辑