上一页 1 ··· 24 25 26 27 28 29 30 31 32 ··· 39 下一页
  2020年8月20日
摘要: 目录: 定义 期望与方差 两个二项分布的协方差 python画图 二项分布与其他分布的关系 一、定义 在n次独立重复的伯努利试验中,设每次试验中事件A发生的概率为p。用 X 表示n重伯努利试验中事件A发生的次数,则X的可能取值为0,1,…,n,且对每一个k(0≤k≤n),事件{X=k}即为“n次试验 阅读全文
posted @ 2020-08-20 14:27 小小喽啰 阅读(6352) 评论(0) 推荐(0) 编辑
  2020年8月19日
摘要: 文章转载于:https://www.cnblogs.com/jiaxin359/p/8615502.html 数据可视化可以帮助我们理解数据:查看数据的分布情况,观察有没有异常值,各个变量之间的相关情况。 当我们进行数据可视化的时候,我们要紧紧围绕着这个变量和我们的目标变量之间的关系,在绘制大多数图 阅读全文
posted @ 2020-08-19 17:11 小小喽啰 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 目录 移除方差较低的特征 VarianceThreshold方法 单变量特征选择 回归特征消除 基于L1正则化的特征选择(线性模型的特征选择) 基于树结构的特征选择 特征选择 特征选择是从数据集的诸多特征里面选择和目标变量相关的特征,去掉那些不相关的特征。 特征选择分为两个问题:一个是子集搜索问题, 阅读全文
posted @ 2020-08-19 15:53 小小喽啰 阅读(415) 评论(0) 推荐(0) 编辑
摘要: reshape可以用于numpy库里的ndarray和array结构以及pandas库里面的DataFrame和Series结构。reshape用来更改数据的列数和行数reshape(行,列)可以根据指定的数值将数据转换为特定的行数和列数;那么reshape(1,-1)或者reshape(-1,1) 阅读全文
posted @ 2020-08-19 10:54 小小喽啰 阅读(1738) 评论(0) 推荐(0) 编辑
  2020年8月18日
摘要: 特征选择 主要思想:包裹式(封装器法)从初始特征集合中不断的选择特征子集,训练学习器,根据学习器的性能来对子集进行评价,直到选择出最佳的子集。包裹式特征选择直接针对给定学习器进行优化 案例一、封装器法 常用实现方法:循序特征选择。 循序向前特征选择:Sequential Forward Select 阅读全文
posted @ 2020-08-18 14:51 小小喽啰 阅读(2508) 评论(0) 推荐(0) 编辑
摘要: pd.to_datetime() 因为不了解该段代码意思: # 不过要注意,数据里有时间出错的格式,所以我们需要 errors='coerce' data['used_time'] = (pd.to_datetime(data['creatDate'], format='%Y%m%d', error 阅读全文
posted @ 2020-08-18 10:34 小小喽啰 阅读(53771) 评论(0) 推荐(1) 编辑
  2020年8月17日
摘要: sklearn.metrics.classification_report()模型评估的一种,输出一个报告 sklearn.metrics.classification_report(y_true, y_pred, labels=None, target_names=None, sample_wei 阅读全文
posted @ 2020-08-17 17:47 小小喽啰 阅读(2301) 评论(0) 推荐(0) 编辑
  2020年8月14日
摘要: 1.皮尔森相关系数(Pearson)评估两个连续变量之间的线性关系 -1 ≤ p ≤ 1p接近0代表无相关性p接近1或-1代表强相关性 代码: #相关系数显著性检验 import numpy as np import scipy.stats as stats import scipy x=np.ar 阅读全文
posted @ 2020-08-14 18:30 小小喽啰 阅读(6940) 评论(0) 推荐(0) 编辑
摘要: 前面已经有了一篇信用卡的文章,拓展不同方法 前面的处理方式都一样,主要不同的是从缺失值开始的: #导入模块 import pandas as pd import numpy as np from scipy import stats import seaborn as sns import matp 阅读全文
posted @ 2020-08-14 10:13 小小喽啰 阅读(1638) 评论(0) 推荐(0) 编辑
摘要: df.as_matrix()可将dataframe数据转换成数组,和df.values 用法一致,但是现在一般使用values ,二者返回的都是数组 #原始DataFrame import pandas as pd import numpy as np df=pd.DataFrame(np.aran 阅读全文
posted @ 2020-08-14 10:08 小小喽啰 阅读(2317) 评论(0) 推荐(0) 编辑
上一页 1 ··· 24 25 26 27 28 29 30 31 32 ··· 39 下一页