随笔分类 -  统计分析

统计学相关
轮盘赌算法
摘要:轮盘赌在遗传算法中应用的很多,效果也不错,而且它的思想很简单直观 —— 物竞天择、适者生存 —— 越强获得的资源越多 —— 在一个圆中,扇形的面积越大,圆中的点落在该扇形的概率越大。 其主要步骤是: 1. 计算每个个体被选中的概率p(在遗传算法中,先通过适应度函数计算适应度,然后根据适应度计算选择概 阅读全文

posted @ 2020-04-17 10:24 落日峡谷 阅读(7869) 评论(0) 推荐(0) 编辑

Python的数据正态性检验
摘要:在做数据分析或者统计的时候,经常需要进行数据正态性的检验,因为很多假设都是基于正态分布的基础之上的,例如:T检验。 在Python中,主要有以下检验正态性的方法: 1. scipy.stats.shapiro —— Shapiro-Wilk test,属于专门用来做正态性检验的模块,其原假设:样本数 阅读全文

posted @ 2020-04-15 20:58 落日峡谷 阅读(8920) 评论(0) 推荐(0) 编辑

Python计算皮尔逊 pearson相关系数
摘要:pearson相关系数:用于判断数据是否线性相关的方法。 注意:不线性相关并不代表不相关,因为可能是非线性相关。 Python计算pearson相关系数: 1. 使用numpy计算(corrcoef),以下是先标准化再求相关系数 import numpy as np import pandas as 阅读全文

posted @ 2020-03-31 21:04 落日峡谷 阅读(32498) 评论(0) 推荐(1) 编辑

Python数据标准化、归一化
摘要:在进行数据分析或者机器学习时,通常需要对数据进行预处理,其中主要的步骤就是数据标准化/归一化。 常用的数据标准化和归一化方法主要有: 1. 最大最小标准化 y=(x-min(x))/(max(x)-min(x)),x为一序列,即x={x1,x2,x3......},max(x)为最大值,min(x) 阅读全文

posted @ 2020-03-31 20:17 落日峡谷 阅读(7080) 评论(0) 推荐(0) 编辑

Python基础笔记二之求序列均值、标准差、中位数、分位数
摘要:python可以通过numpy库来快速实现数组/序列运算,包括均值、标准差、分位数等。 1. 首先导入包numpy import numpy as np 2. 建立序列,可用 np.array aa = np.array([1,2,3,4,5]) 3. 求均值 np.mean: print(np.m 阅读全文

posted @ 2020-02-22 17:59 落日峡谷 阅读(3737) 评论(0) 推荐(0) 编辑

Excel的VLOOKUP函数
摘要:当有两个表要进行对比时,VLOOKUP可以很快帮我们解决问题。 例如:当要比较两次数据中,相同项目的变化率,VLOOKUP可以快速得到想要的结果。 1. 首先使用VLOOKUP得到前一次的数据值,在新一列的对应行即E2框输入:=VLOOKUP(C2,A:B,2,FALSE),然后回车,之后下拉填充 阅读全文

posted @ 2020-02-18 10:28 落日峡谷 阅读(809) 评论(0) 推荐(0) 编辑

python求极值点(波峰波谷)
摘要:python求极值点主要用到scipy库。 1. 首先可先选择一个函数或者拟合一个函数,这里选择拟合数据:np.polyfit import pandas as pd import matplotlib.pyplot as plt import numpy as np from scipy impo 阅读全文

posted @ 2020-02-17 21:20 落日峡谷 阅读(32354) 评论(0) 推荐(1) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示