王昱棋

导航

2020年8月22日 #

count(*) 与 count(1)的区别?

摘要: 在mysql与oracle中 如果在开发中确实需要用到count()聚合,那么优先考虑count(*),因为mysql数据库本身对于count(*)做了特别的优化处理。 有主键或联合主键的情况下,count(*)略比count(1)快一些。 没有主键的情况下count(1)比count(*)快一些。 阅读全文

posted @ 2020-08-22 23:23 王昱棋 阅读(1422) 评论(0) 推荐(0) 编辑

星型模型与雪花模型有什么优缺点

摘要: 问:什么是星型模型? 答:星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余。 问:什么是雪花模型? 答:当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星 阅读全文

posted @ 2020-08-22 21:03 王昱棋 阅读(3945) 评论(0) 推荐(0) 编辑

2020年4月1日 #

如何估计数据需要存储空间

摘要: 如果大概估算出数据所占用的存储空间 1.存储的单位换算 1字节(b)=8比特(bit) 1千字节(kb)=1024字节(b) 1兆字节(mb)=1024千字节(kb) 1千兆字节(gb)=1024兆字节(mb) 1太字节(tb)=1024千兆字节(gb) 1拍字节(pb)=1024太字节(tb) 1 阅读全文

posted @ 2020-04-01 19:52 王昱棋 阅读(1653) 评论(0) 推荐(0) 编辑

2019年12月15日 #

第七周作业-使用Python实现抽样分布的验证(正态分布、卡方分布、T分布等)

摘要: 1.验证数据是否服从正态分布? 验证年龄是否服从正态分布 验证是否服从正态分布 由于p<0.05,拒绝原假设,认为数据不服从正态分布 绘制拟合正态分布曲线 2验证是否服从T分布 p<0.05,拒绝原假设,认为数据不服从T分布 绘制拟合的T分布图 3.验证数据是否服从卡方分布 对数据进行卡方拟合 阅读全文

posted @ 2019-12-15 21:31 王昱棋 阅读(1257) 评论(0) 推荐(0) 编辑

2019年12月8日 #

第六章统计量及其抽样分布

摘要: ![](https://img2018.cnblogs.com/blog/1537138/201912/1537138-20191208124104951-1549761348.jpg) 阅读全文

posted @ 2019-12-08 12:42 王昱棋 阅读(265) 评论(0) 推荐(0) 编辑

2019年12月1日 #

Python实现概率分布(二项分布、伯努利分布、泊松分布、几何分布、正态分布等)

摘要: 1.二项分布 二项分布 几何分布 几何分布就是在n次伯努利试验中,试验k次才得到第一次成功的机率。 泊松分布 泊松分布描述的是已知一段时间内事件发生的平均数,求某个时间内发生的概率。 正态分布 阅读全文

posted @ 2019-12-01 22:46 王昱棋 阅读(1500) 评论(0) 推荐(0) 编辑

2019年11月24日 #

4.概率与概率分布

摘要: ![](https://img2018.cnblogs.com/blog/1537138/201911/1537138-20191124213208984-2116264115.jpg) 阅读全文

posted @ 2019-11-24 21:32 王昱棋 阅读(168) 评论(0) 推荐(0) 编辑

2019年11月17日 #

3.描述性统计

摘要: ```python import pandas as pd import numpy as np import matplotlib.pyplot as plt path="D:\\统计学学习小组\\three_test1.csv" data = pd.read_csv(path, encoding 阅读全文

posted @ 2019-11-17 21:30 王昱棋 阅读(124) 评论(0) 推荐(0) 编辑

2019年11月3日 #

统计学小组

摘要: 数据的图标展示 1.数据的预处理 数据的预处理是在对数据分类或分组钱所做的必要处理,包括:数据审核、筛选、排序。 1.1数据审核 数据完整性:检查应调查的单位或个体是否有遗漏,所有的调查项目是否填写齐全。 数据准确性:检查数据是否有错误,是否存在异常值。对于异常值要仔细甄别。 二手数据:实用性、时效 阅读全文

posted @ 2019-11-03 22:57 王昱棋 阅读(325) 评论(0) 推荐(0) 编辑

2019年10月30日 #

第三次的课程 条件概率,全概率,贝叶斯公式

摘要: 1.条件概率: 已知某个事件A发生的条件下,另一个事件B发生的概率称为条件概率,记为P(B|A) 看一下P(B|A)与P(A)、P(B)的关系:P(B|A)=P(AB)/P(A) 条件概率的三个条件: 非负性:P(B|A) ≥0; 规范性:对于必然事件S,有P(S|A)=1 可列可加性:对于两两互不 阅读全文

posted @ 2019-10-30 11:40 王昱棋 阅读(1229) 评论(0) 推荐(0) 编辑