会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
小小喽啰
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
24
25
26
27
28
29
30
31
32
···
39
下一页
2020年8月20日
二项分布
摘要: 目录: 定义 期望与方差 两个二项分布的协方差 python画图 二项分布与其他分布的关系 一、定义 在n次独立重复的伯努利试验中,设每次试验中事件A发生的概率为p。用 X 表示n重伯努利试验中事件A发生的次数,则X的可能取值为0,1,…,n,且对每一个k(0≤k≤n),事件{X=k}即为“n次试验
阅读全文
posted @ 2020-08-20 14:27 小小喽啰
阅读(6352)
评论(0)
推荐(0)
编辑
2020年8月19日
转:数据预处理之数据可视化总结
摘要: 文章转载于:https://www.cnblogs.com/jiaxin359/p/8615502.html 数据可视化可以帮助我们理解数据:查看数据的分布情况,观察有没有异常值,各个变量之间的相关情况。 当我们进行数据可视化的时候,我们要紧紧围绕着这个变量和我们的目标变量之间的关系,在绘制大多数图
阅读全文
posted @ 2020-08-19 17:11 小小喽啰
阅读(373)
评论(0)
推荐(0)
编辑
特征选择
摘要: 目录 移除方差较低的特征 VarianceThreshold方法 单变量特征选择 回归特征消除 基于L1正则化的特征选择(线性模型的特征选择) 基于树结构的特征选择 特征选择 特征选择是从数据集的诸多特征里面选择和目标变量相关的特征,去掉那些不相关的特征。 特征选择分为两个问题:一个是子集搜索问题,
阅读全文
posted @ 2020-08-19 15:53 小小喽啰
阅读(415)
评论(0)
推荐(0)
编辑
pandas的reshape(1,-1)
摘要: reshape可以用于numpy库里的ndarray和array结构以及pandas库里面的DataFrame和Series结构。reshape用来更改数据的列数和行数reshape(行,列)可以根据指定的数值将数据转换为特定的行数和列数;那么reshape(1,-1)或者reshape(-1,1)
阅读全文
posted @ 2020-08-19 10:54 小小喽啰
阅读(1738)
评论(0)
推荐(0)
编辑
2020年8月18日
mlxtend.feature_selection 特征工程
摘要: 特征选择 主要思想:包裹式(封装器法)从初始特征集合中不断的选择特征子集,训练学习器,根据学习器的性能来对子集进行评价,直到选择出最佳的子集。包裹式特征选择直接针对给定学习器进行优化 案例一、封装器法 常用实现方法:循序特征选择。 循序向前特征选择:Sequential Forward Select
阅读全文
posted @ 2020-08-18 14:51 小小喽啰
阅读(2508)
评论(0)
推荐(0)
编辑
pd.to_datetime() 时间处理函数
摘要: pd.to_datetime() 因为不了解该段代码意思: # 不过要注意,数据里有时间出错的格式,所以我们需要 errors='coerce' data['used_time'] = (pd.to_datetime(data['creatDate'], format='%Y%m%d', error
阅读全文
posted @ 2020-08-18 10:34 小小喽啰
阅读(53771)
评论(0)
推荐(1)
编辑
2020年8月17日
sklearn.metrics.classification_report分类模型评估
摘要: sklearn.metrics.classification_report()模型评估的一种,输出一个报告 sklearn.metrics.classification_report(y_true, y_pred, labels=None, target_names=None, sample_wei
阅读全文
posted @ 2020-08-17 17:47 小小喽啰
阅读(2301)
评论(0)
推荐(0)
编辑
2020年8月14日
Pearson相关系数和Spearman相关系数的区别
摘要: 1.皮尔森相关系数(Pearson)评估两个连续变量之间的线性关系 -1 ≤ p ≤ 1p接近0代表无相关性p接近1或-1代表强相关性 代码: #相关系数显著性检验 import numpy as np import scipy.stats as stats import scipy x=np.ar
阅读全文
posted @ 2020-08-14 18:30 小小喽啰
阅读(6940)
评论(0)
推荐(0)
编辑
信用卡评分模型(二)python
摘要: 前面已经有了一篇信用卡的文章,拓展不同方法 前面的处理方式都一样,主要不同的是从缺失值开始的: #导入模块 import pandas as pd import numpy as np from scipy import stats import seaborn as sns import matp
阅读全文
posted @ 2020-08-14 10:13 小小喽啰
阅读(1638)
评论(0)
推荐(0)
编辑
pandas 的 df.as_matrix() 表格转换成数组函数用法
摘要: df.as_matrix()可将dataframe数据转换成数组,和df.values 用法一致,但是现在一般使用values ,二者返回的都是数组 #原始DataFrame import pandas as pd import numpy as np df=pd.DataFrame(np.aran
阅读全文
posted @ 2020-08-14 10:08 小小喽啰
阅读(2317)
评论(0)
推荐(0)
编辑
上一页
1
···
24
25
26
27
28
29
30
31
32
···
39
下一页