12 2019 档案
发表于 2019-12-29 20:58阅读:1403评论:1推荐:0
摘要:求置信区间 抽取样本, 样本量为200 np.random.seed(42) coffee_full = pd.read_csv('coffee_dataset.csv') coffee_red = coffee_full.sample(200) #this is the only data you
阅读全文 »
发表于 2019-12-25 15:40阅读:727评论:0推荐:0
摘要:百度经验上看到一篇对堆栈队列讲解很不错的文章; mark下:https://jingyan.baidu.com/article/6c67b1d6a09f9a2786bb1e4a.html
阅读全文 »
发表于 2019-12-22 21:33阅读:164评论:0推荐:0
摘要:在抽样与抽样分布的基础上,根据样本统计量来推断总体参数。 详见简书:https://www.jianshu.com/p/5445b95379ce
阅读全文 »
发表于 2019-12-18 21:15阅读:250评论:0推荐:0
摘要:网上看到这个问题,但自己不太熟记录下 参考:https://www.jianshu.com/p/2581342317ce
阅读全文 »
发表于 2019-12-16 11:19阅读:2259评论:0推荐:0
摘要:代码 import pandas as pd import numpy as np import plotly.plotly as py import plotly.graph_objs as go path = '/home/v-gazh/PycharmProjects/us_data/limit
阅读全文 »
发表于 2019-12-15 22:35阅读:1685评论:0推荐:0
摘要:参考链接:https://github.com/v-gazh/LearningStatsGroup/blob/master/week7/week7.ipynb 源地址:https://github.com/AeneasZhu/LearningStatsGroup/blob/master/week7/
阅读全文 »
发表于 2019-12-12 18:49阅读:1245评论:0推荐:0
摘要:代码 import pandas as pd import numpy as np import plotly.plotly as py import plotly.graph_objs as go path = '/home/v-gazh/PycharmProjects/us_data/count
阅读全文 »
发表于 2019-12-09 15:49阅读:504评论:0推荐:0
摘要:outline 下午需要简单处理一份数据,就直接随手写脚本处理了,但发现效率太低,速度太慢,就改成多进程了; 程序涉及计算、文件读写,鉴于计算内容挺多的,就用多进程了(计算密集)。 代码 import pandas as pd from pathlib import Path from concur
阅读全文 »
发表于 2019-12-08 19:29阅读:2815评论:0推荐:0
摘要:统计量 统计学中最主要的提取信息的方式就是对原始信息进行一定的运算,得出某些代表性的数字,以反映数据某些方面的特征,这种数字被称为统计量。用统计学语言表述,统计量是样本的函数,它不依赖于任何未知函数。推断统计学的重要作用就是,通过从总体中抽取样本构造适当的统计量。 常用统计量 抽样分布 在总体X的分
阅读全文 »
发表于 2019-12-01 20:14阅读:623评论:0推荐:0
摘要:二项分布式 import numpy as np import matplotlib.pyplot as plt list = np.random.binomial(n=10, p=0.5,size = 10000) plt.hist(list, bins = 8,color = 'g', alph
阅读全文 »