摘要: 特征选择原因: 冗余:部分特征的相关度高,容易消耗计算性能 噪声:部分特征对预测结果有影响 一,特征选择(过滤式) 删除低方差的特征 特征选取代码如下: from sklearn.feature_selection import VarianceThreshold def var(): """ 特征 阅读全文
posted @ 2021-01-22 22:17 凝气强者 阅读(270) 评论(0) 推荐(0) 编辑
摘要: 一,归一化 处理不同特征之间数据相差不是太大的问题。 特征1 特征2 特征3 特征4 80 2 10 30 40 4 15 40 30 3 12 45 以计算80这个位置进行转换为例,特征1这一列 x‘=(80-30)/(80-30)=1 x''=1*(1-0)+0=1 故80转换化为x''=1 其 阅读全文
posted @ 2021-01-22 22:14 凝气强者 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 导入相关的包: 1 import numpy as np 2 #NumPy 是一个 Python 包。 它代表 “Numeric Python”。 它是一个由多维数组对象和用于处理数组的例程集合组成的库。 3 import matplotlib.pyplot as plt 4 #matplotlib 阅读全文
posted @ 2021-01-21 16:23 凝气强者 阅读(71) 评论(1) 推荐(0) 编辑
摘要: 一.字典特征数据抽取 把字典中一些类别数据,分别进行转换成特征数据(one-hot). 在机器学习中为了方便日后的数据处理,我们需要对数据进行抽取,如:{‘name’:'李华','age':23}这样一条数据,数据量很小,处理起来很方便,但是当数据量非常大的时候,直接处理就会显得很是耗费处理资源,所 阅读全文
posted @ 2021-01-21 16:17 凝气强者 阅读(171) 评论(0) 推荐(0) 编辑
摘要: Sample Input 1 9 4 2 3 1 1 4 1 2 4 1 5 3 6 6 Sample Output 1 15 多个数组遍历解决: package kaoshi; import java.util.Scanner; public class Happy { public static 阅读全文
posted @ 2020-11-06 20:18 凝气强者 阅读(89) 评论(0) 推荐(0) 编辑