正态分布密度函数的动画演示—R语言

正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布,例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

一、正态分布的哲学观

在联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面积分布图为表征(以后谈及正态分布及正态分布论就要浮现此图),进行抽象与提升,抓主其中的主要哲学内涵,归纳正态分布论(正态哲学)的主要内涵如下:

1.1 正态分布发展论(动态)

联系和发展是事物发展变化的基本规律。任何事物都有其产生、发展和灭亡的历史,如果我们把正态分布看做是任何一个系统或者事物的发展过程的话,我们明显的看到这个过程经历着从负区到基区再到正区的过程。无论是自然、社会还是人类的思维都明显的遵循这这样一个过程。准确的把握事物或者事件所处的历史过程和阶段极大的有助于掌握我们对事物、事件的特征和性质,是我们分析问题,采取对策和解决问题的重要基础和依据。发展的阶段不同,性质和特征也不同,分析和解决问题的办法要与此相适应,这就是具体问题具体分析,也是解放思想、实事求是、与时俱乐进的精髓。正态发展的特点还启示我们,事物发展大都是渐进的和累积的,走渐进发展的道路是事物发展的常态。例如,遗传是常态,变异是非常态。

1.2 正态分布整体论(静态)

正态分布启示我们,要用整体的观点来看事物。“系统的整体观念或总体观念是系统概念的精髓。” 正态分布曲线及面积分布图由基区、负区、正区三个区组成,各区比重不一样。用整体来看事物才能看清楚事物的本来面貌,才能得出事物的根本特性。不能只见树木不见森林,也不能以偏概全。此外整体大于部分之和,在分析各部分、各层次的基础上,还要从整体看事物,这是因为整体有不同于各部分的特点。用整体观来看世界,就是要立足在基区,放眼负区和正区。要看到主要方面,还要看到次要方面,既要看到积极的方面还要看到事物消极的一面,看到事物前进的一面还要看到落后的一面。片面看事物必然看到的是偏态或者是变态的事物,不是真实的事物本身。

1.3 正态分布重点论

正态分布曲线及面积分布图非常清晰的展示了重点,那就是基区占68.27%,是主体,要重点抓,此外95%,99%则展示了正态的全面性。认识世界和改造世界一定要住住重点,因为重点就是事物的主要矛盾,它对事物的发展起主要的、支配性的作用。抓住了重点才能一举其纲,万目皆张。事物和现象纷繁复杂,在千头万绪中不抓住主要矛盾,就会陷入无限琐碎之中。由于我们时间和精力的相对有限性,出于效率的追求,我们更应该抓住重点。在正态分布中,基区占了主体和重点。如果我们结合20/80法则,我们更可以大胆的把正区也可以看做是重点。
总之正态分布论是科学的世界观,也是科学的方法论,是我们认识和改造世界的最重要和最根本的工具之一,对我们的理论和实践有重要的指导意义。以正态哲学认识世界,能更好的认识和把握世界的本质和规律,以正态哲学来改造世界,能更好的在尊重和利用客观规律,更有效的改造世界。

二、正态分布的动态演示

若随机变量X服从一个数学期望为\({\mu}\)、方差为\({\sigma^2}\)的正态分布,则期望值\({\mu}\)决定密度函数的位置(集中趋势),标准差\({\sigma}\)决定密度函数分布的幅度(离中程度或离散程度)。

2.1 \({\mu}\)的作用演示

rm(list = ls())               # 清空工作空间!
library(ggplot2)              # 加载相关R包
library(gganimate)
library(dplyr)
library(gifski)

sigma=1                       # 标准差取值
x=seq(-3.9,12,by=0.1)         # x的值域范围
k=seq(0.5,9,by=0.5)           # 期望mu的变化范围
d1=data.frame()

for (i in 1:length(k))        # 作图数据生成
   {mu1=0
    mu1=mu1+k[i]
    y1 = exp(-(x - mu1) ** 2 / (2 * sigma ** 2)) / (sqrt(2*pi)*sigma)
    x1=x
    mu=mu1
    d2=cbind(x1,y1,mu,sigma)
    d1=rbind(d1,d2)
}

p<- ggplot(d1, mapping=aes(x=x1, y=y1, group=mu)) +
    geom_point(color="blue", size=1)+
    labs(x = "正态分布密度函数的变化", y="")
#动画生成        
anim1<-p + transition_time(mu,) +
         labs(title = "mu: {frame_time}")
#动画生成格式     
myanimation<-animate(anim1,nframes=18,width=1920,height=1080,
                            renderer = gifski_renderer(),res=180)         
myanimation

2.2 \({\sigma}\)的作用演示

rm(list = ls())               # 清空工作空间!
library(ggplot2)              # 加载相关R包
library(gganimate)
library(dplyr)
library(gifski)

x =seq(-3.9,12,by=0.1)
l=seq(5,0.5,by=-0.5)
d1=data.frame()
mu=4

for (j in 1:length(l))
   {sigma1=0
    sigma1=sigma1+l[j]
    y1 = exp(-(x - mu) ** 2 / (2 * sigma1 ** 2)) / (sqrt(2*pi)*sigma1)
    x1=x
    sigma=sigma1
    d2=cbind(x1,y1,mu,sigma)
    d1=rbind(d1,d2)
   }

p<- ggplot(d1, mapping=aes(x=x1, y=y1, group=sigma)) +
  geom_point(color="blue", size=1)+
  labs(x = "正态分布密度函数的变化", y="")
anim2<-p + transition_time(sigma,) +
  labs(title = "sigma: {frame_time}")
myanimation<-animate(anim2,nframes=10,width=1920,height=1080,
                     renderer = gifski_renderer(),res=180)         
myanimation

三、正态分布的静态图示

3.1 正态分布随期望\({\mu}\)值的变化

# 清空工作空间!
rm(list = ls())
library(ggplot2)
library(gganimate)
library(dplyr)
library(gifski)

x =seq(-3.9,12,by=0.1)
sigma=1
l=c(0.5,2,3.5)
d1=data.frame()

for (j in 1:length(l))
{mu1=0
mu1=mu1+l[j]
y1 = exp(-(x - mu1) ** 2 / (2 * sigma ** 2)) / (sqrt(2*pi)*sigma)
x1=x
mu=mu1
d2=cbind(x1,y1,mu,sigma)
d1=rbind(d1,d2)
}

p<- ggplot(d1, mapping=aes(x=x1, y=y1, group=mu)) +
  geom_line(color="blue", size=1)+
  facet_wrap(~mu) +
  labs(title = '正态分布随期望的变化', x = '密度函数', y = '')
p

3.2 正态分布随标准差\({\sigma}\)值的变化

# 清空工作空间!
rm(list = ls())
library(ggplot2)
library(gganimate)
library(dplyr)
library(gifski)

x =seq(-3.9,12,by=0.1)
mu=4
l=c(0.5,1,1.5)
d1=data.frame()

for (j in 1:length(l))
   {sigma1=0
    sigma1=sigma1+l[j]
    y1 = exp(-(x - mu) ** 2 / (2 * sigma1 ** 2)) / (sqrt(2*pi)*sigma1)
    x1=x
    sigma=sigma1
    d2=cbind(x1,y1,mu1,sigma)
    d1=rbind(d1,d2)
   }

p<- ggplot(d1, mapping=aes(x=x1, y=y1, group=sigma)) +
  geom_line(color="blue", size=1)+
  facet_wrap(~sigma) +
  labs(title = '正态分布随标准差的变化', x = '密度函数', y = '')
p

四、总结

“一张图胜过千言万语”,这句话在描述正态分布时尤为贴切。正态分布的形状由两个关键参数决定:期望(均值)和方差。其中,期望决定了正态分布的中心位置,也就是对称轴所在的位置,反映了数据的集中趋势。正态分布的对称性意味着数据均匀分布在均值的两侧。方差则决定了正态分布的“胖瘦”,即分布的离散程度。方差越大,数据的波动性越大,正态分布就会变得“胖而矮”,意味着数据分布较为分散;相反,方差较小,正态分布会“瘦而高”,即数据更集中。因此,方差不仅影响分布的广度,还影响了峰值的高度,揭示了数据在总体中的分布特征。通过期望和方差的变化,正态分布的形态可以直观反映数据的集中性和离散性。

参考文献

  1. 《正态哲学》-正态分布的哲学本质及世界观意义
  2. (gganimate——让你的图形动起来!(一)
posted @ 2022-06-25 06:42  郝hai  阅读(780)  评论(0编辑  收藏  举报