随笔分类 - 统计分析
摘要:1、加载库 import os, sys, re import numpy as np import pandas as pd import matplotlib.pyplot as plt 2、读取数据 path = r'E:\数据集' data_file = os.path.join(path,
阅读全文
摘要:1、模拟 27 次投掷硬币的伯努利试验 代码: from scipy import stats import numpy as np p = 0.5 # 生成冻结分布函数 bernoulliDist = stats.bernoulli(p) # 模拟 27 次伯努利实验 trails = berno
阅读全文
摘要:在 skilearn 的手写数据集中,每个数据点都是 0 到 9 之间手写数字的一张 8*8 灰度图像。用 PCA 将其降维到二维,并可视化数据点,如下: 1、digits 数据演示: import matplotlib.pyplot as plt from sklearn.datasets imp
阅读全文
摘要:极大似然估计是一种用已知的样本数据分布去推测具体的分布情况统计学的方法。 使用极大似然估计方法的两个条件:1.假定数据服从某种已知的特定数据分布型;2.已经得到了一定的数据集。 以下用估计馒头重量的分布情况举例。 背景:对食堂所卖馒头的重量进行估计。根据现统计知识,可以假定某一日食堂所做的全部馒头的
阅读全文
摘要:极大似然估计的思想是:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实 关于极大似然原理的引例: 设有甲乙两个箱子,各箱都有黑白两种球共100个,其组成情况如下: 甲箱 乙箱 白球 99 1 黑球 1 99 现随机取出一箱,再从抽取的一
阅读全文
摘要:似然与概率 在统计中,似然函数(likelihood function)通常简写为似然( likelihood)。在非正式场合似然和概率(Probability)几乎是同义词,但在统计学中,似然和概率却是两个不同的概念。概率是在特定环境下某件事情发生的可能性,也就是结果没有产生之前依据环境所对应的参
阅读全文
摘要:观察从标准正态分布随机抽取的 100 个样本的 25 个分布。 Python 代码 import numpy as np import matplotlib.pyplot as plt fig, axes = plt.subplots(5, 5) # 生成数据,绘制分布图形 for i, ax in
阅读全文