摘要: 1 标准化 & 归一化 导包和数据 import numpy as np from sklearn import preprocessing data = np.loadtxt('data.txt', delimiter='\t') 1.1 标准化 (Z-Score) x'=(x-mean)/std 阅读全文
posted @ 2020-02-27 18:54 机器快点学习 阅读(9173) 评论(0) 推荐(2) 编辑
摘要: 判断异常值方法:Z-Score 计算公式 Z = (X-μ)/σ 其中μ为总体平均值,X-μ为离均差,σ表示标准差。z的绝对值表示在标准差范围内的原始分数与总体均值之间的距离。当原始分数低于平均值时,z为负,以上为正。 代码演示 1 生成一个 df 1 import pandas as pd # 导 阅读全文
posted @ 2020-02-27 12:16 机器快点学习 阅读(8341) 评论(1) 推荐(0) 编辑
摘要: 1 简介 scikit-learn,又写作sklearn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法。 SKlearn官网:http://scikit-lear 阅读全文
posted @ 2020-02-27 11:53 机器快点学习 阅读(503) 评论(0) 推荐(0) 编辑