现代精算风险理论02:个体风险模型

第二讲 个体风险模型

第一节 个体风险模型的分布

一、定义和相关说明

在个体风险模型中,我们感兴趣的是多份保单总理赔额的分布。首先给出其定义和相关说明。

\(X_1,X_2,\cdots,X_n\) 分别为 \(n\) 份保单的理赔额,假设理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 是相互独立的,定义个体风险模型

\[S_n=X_1+X_2+\cdots+X_n. \]

个体风险模型又称为短期风险模型,即不考虑时间因素,保单总数 \(n\) 为非随机的风险模型。

从数学的角度看,总理赔额 \(S_n\) 是独立同分布的随机变量的和。我们的研究目标就是个体风险模型 \(S_n\) 的分布函数和数字特征等。

关于个体风险模型的一些说明:

  1. 一般非寿险保险的合同期往往较短,绝大多数是一年期。因此,通常不考虑货币的时间价值。但对于寿险来说,货币的时间价值是非常重要的。
  2. 独立性的假设在保险实务中往往是不满足的。例如同一建筑中不同楼层的火灾保险保单,那么这些保单风险相互之间是不独立的。同样,当某一自然灾害发生时,如地震、台风等,同一地区的各类人寿保险或财产保险的索赔风险也是相关的。
  3. 本章中我们总是假设理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 是相互独立的。

二、卷积与变换

卷积运算是通过两个独立随机变量 \(X\)\(Y\) 的分布函数来计算它们的和 \(X+Y\) 的分布函数的计算方法:

\[\begin{aligned} F_{X+Y}(s)&=\mathrm{Pr}(X+Y\leq s) \\ \\ &=\int_{-\infty}^\infty\mathrm{Pr}(X+Y\leq s|X=x)\mathrm{d}F_X(x) \\ \\ &=\int_{-\infty}^\infty\mathrm{Pr}(Y\leq s-x)\mathrm{d}F_X(x) \\ \\ &=\int_{-\infty}^\infty F_Y(s-x)\mathrm{d}F_X(x) \\ \\ &\equiv F_X*F_Y(s). \end{aligned} \]

分布函数 \(F_X* F_Y(s)\) 称为分布函数 \(F_X(\cdot)\)\(F_Y(\cdot)\) 的卷积,即为 \(X+Y\) 的分布函数 \(F_{X+Y}(s)\)

如果 \(X\)\(Y\) 是离散型随机变量,用 \(f_X(\cdot)\)\(f_Y(\cdot)\) 表示其概率分布列,则有

\[f_X*f_Y(s)=\sum_{x}f_Y(s-x)f_X(x), \]

其中求和是取遍所有使得 \(f_X(x)>0\)\(x\) ,即随机变量 \(X\) 的所有可能取值。

如果 \(X\)\(Y\) 是连续型随机变量,用 \(f_X(\cdot)\)\(f_Y(\cdot)\) 表示其概率密度函数,则有

\[f_X*f_Y(s)=\int_{-\infty}^\infty f_Y(s-x)f_X(x)\mathrm{d}x. \]

注意:卷积运算满足交换律结合律,即

\[F_X*F_Y(s)=F_Y*F_X(s) , \\ \\ \left(F_X*F_Y\right)*F_Z(s)=F_X*\left(F_Y*F_Z\right)(s)=F_X*F_Y*F_Z(s). \]

卷积运算可以用来计算个体风险模型总理赔额的分布函数:

  • 如果理赔风险 \(X_i\) 的分布函数为 \(F_i(x)\ (i=1,2,\cdots,n)\) 且相互独立,则 \(S_n\) 的分布函数为

    \[F_{S_n}(s)=F_1*F_2*\cdots*F_n(s). \]

  • 进一步假设 \(F_i(x)=F(x) \ (i=1,2,\cdots,n)\) ,则 \(S_n\) 的分布函数为

    \[F_{S_n}(s)=F*F\cdots*F(s)\equiv F^{*n}(s). \]

    称为分布函数 \(F(x)\)\(n\) 重卷积。

利用 Laplace 变换可以方便我们对卷积进行运算:

  • Laplace 变换:对于函数 \(f(t)\) ,如果积分

    \[F(s)\equiv\int_0^\infty f(t)e^{-st}\mathrm{d}t<\infty, \]

    则称 \(F(s)\) 为函数 \(f(t)\) 的 Laplace 变换,记为 \(F(s)=\mathcal{L}[f(t)]\)

    也称 \(f(t)\) 为函数 \(F(s)\) 的 Laplace 逆变换,记为 \(f(t)=\mathcal{L}^{-1}[F(s)]\)

  • 卷积定理:对于函数 \(f(t)\)\(g(t)\) ,其卷积的 Laplace 变换为

    \[\mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s), \]

    其中 \(F(s)\)\(G(s)\) 分别为 \(f(t)\)\(g(t)\) 的 Laplace 变换。

例如:设随机变量 \(X\)\(Y\) 分别服从 \(\Gamma(\alpha_1,\beta)\)\(\Gamma(\alpha_2,\beta)\) ,其密度函数分别为 \(f(t)\)\(g(t)\) ,利用 Laplace 变换可得

\[\begin{aligned} &F(s)=\mathcal{L}[f(t)]=\int_0^\infty\frac{\beta^{\alpha_1}}{\Gamma(\alpha_1)}t^{\alpha_1-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1}, \\ \\ &G(s)=\mathcal{L}[g(t)]=\int_0^\infty\frac{\beta^{\alpha_2}}{\Gamma(\alpha_2)}t^{\alpha_2-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_2}. \end{aligned} \]

由卷积定理可知

\[\mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s)=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1+\alpha_2}. \]

比较 \(\Gamma\) 分布的 Laplace 变换,可知 \(X+Y\) 仍服从 \(\Gamma\) 分布,参数为 \((\alpha_1+\alpha_2,\beta)\)

利用 Laplace 变换判断随机变量的方法,和矩母函数、特征函数的道理是一致的。

第二节 近似分布

一、中心极限定理

在概率论的极限理论中,当样本量足够大时,我们可以用中心极限定理去近似随机变量的和的分布。首先我们回顾一下中心极限定理。

中心极限定理:设 \(X_1,X_2,\cdots,X_n\) 独立同分布,其共同的均值为 \(\mu\) ,方差为 \(\sigma^2<\infty\) ,则有

\[\lim_{n\to\infty}{\rm Pr}\left[\sum_{i=1}^nX_i\leq n\mu+s\sigma\sqrt{n}\right]=\Phi(x), \]

其中 \(\Phi(x)\) 为标准正态分布的分布函数。

基于上述结果,个体风险模型 \(S_n\) 的近似分布可以表示为

\[F_S(s)\approx \Phi\left(s;n\mu,n\sigma^2\right). \]

然而,中心极限定理并不适用于损失分布的近似。这是因为保险风险往往是尾部较重的风险,用正态分布来近似随机变量的和的分布,特别是对尾部概率的近似,并不能够很好的符合实际情况。

在进行精算分析时,对尾部概率的近似估计往往愿意采用保守的估计,即和精确值比较接近,可以略大于精确值。常用的两种近似分布是平移伽马近似和正态幂阶近似。

二、平移伽马近似

选择平移伽马分布作为损失分布的近似分布,主要原因是大多数非寿险保单的理赔分布近似伽马分布,其特点为右偏态,取值非负,且具有单峰性。

一般伽马分布有 \(\alpha\)\(\beta\) 两个参数,\(\Gamma(\alpha,\beta)\) 的密度函数为

\[f(x;\alpha,\beta)=\frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} , \quad x>0. \]

\(Z\sim \Gamma(\alpha,\beta)\) ,则 \(Z\) 的均值、方差和偏度分别为

\[\mathbb{E}(Z)=\frac{\alpha}{\beta},\quad {\rm Var}(Z)=\frac{\alpha}{\beta^2},\quad \gamma_Z=\frac{3}{\sqrt{\alpha}}. \]

平移伽马分布引入了第三个参数——偏移 \(x_0\) ,即采用 \(Z+x_0\) 的分布作为损失分布 \(S\) 的近似,

\[S\stackrel{d}{\approx}Z+x_0, \\ \\ F_S(s)\approx \mathrm{Pr}(Z+x_0\leq s)=G(s-x_0;\alpha,\beta), \]

其中 \(G(x;\alpha,\beta)\)\(\Gamma(\alpha,\beta)\) 的分布函数。

平移伽马分布的均值、方差和偏度分别为

\[\mathbb{E}(Z+x_0)=x_0+\frac\alpha\beta , \quad {\rm Var}(Z+x_0)=\frac\alpha{\beta^2},\quad \gamma_{Z+x_0}=\frac{2}{\sqrt{\alpha}}. \]

如果已知损失 \(S\) 的均值、方差和偏度分别为 \(\mu_S,\sigma_S^2\)\(\gamma_S\) 。如果我们采用两个分布对应的前三阶矩相同的方式给出近似分布,则 \(\alpha,\beta\)\(x_0\) 的选取需要满足如下的方程:

\[\begin{aligned} &\mu_S=\mathbb{E}(Z+x_0)=x_0+\frac\alpha\beta, \\ \\ &\sigma_S^2={\rm Var}(Z+x_0)=\frac\alpha{\beta^2}, \\ \\ &\gamma_S=\gamma_{Z+x_0}=\frac{2}{\sqrt{\alpha}}. \end{aligned} \]

解方程可得

\[\alpha=\frac{4}{\gamma_S^2}, \quad \beta=\frac{2}{\gamma_S\sigma_S},\quad x_0=\mu_S-\frac{2\sigma_S}{\gamma_S}. \]

注意:

  • 为使这种近似方法有效,偏度必须严格为正值,即 \(\gamma_S>0\) 。若 \(\gamma_S\to0\) ,则与正态近似接近。
  • 如果两个分布函数的前三阶矩相同,则彼此之间的差异不会太大。
  • 虽然没有类似中心极限定理一样精确的理论证明,但实际经验发现,大多数损失分布采用平移伽马分布作为近似有较好的效果。

三、正态幂阶近似

另一种损失分布的近似方法是正态幂阶近似,又称为 NP 近似,它也是一种使用近似随机变量前三阶矩的近似方法,要求损失分布的矩母函数存在。

如果已知 \(\mathbb{E}(S)=\mu_S,\ {\rm Var}(S)=\sigma_S^2\) 以及偏度 \(\gamma_S\) ,则当 \(s\geq1\) 时,

\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq s+\frac{\gamma_S}{6}(s^2-1)\right]\approx\Phi(s). \]

或等价地,当 \(x\geq1\) 时,

\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq x\right]\approx\Phi\left(\sqrt{\frac{9}{\gamma_S^2}+\frac{6x}{\gamma_S}+1}-\frac{3}{\gamma_S}\right). \]

一般地,第一个公式可以得到近似 \(S\) 的分位数,第二个公式可以得到近似 \(S\) 的分布函数。

引理:设 \(X_i\ (i=1,2,\cdots,n)\) 是独立同分布的随机变量,其偏度为 \(\gamma_X\) ,定义随机变量

\[S=X_1+X_2+\cdots+X_n, \]

\(S\) 的偏度为

\[\gamma_S=n^{-1/2}\gamma_X. \]

首先计算 \(S\) 的前三阶矩:

\[\begin{aligned} &\mathbb{E}(S)=n\mathbb{E}(X), \\ \\ &{\rm Var}(S)=n{\rm Var}(X) , \\ \\ &\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]=\mathbb{E}\left[\sum_{i=1}^n(X_i-\mathbb{E}(X_i))\right]^3=n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]. \end{aligned} \]

所以

\[\gamma_S=\frac{\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]}{(\sqrt{{\rm Var}(S)})^3}=\frac{n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]}{(\sqrt{n{\rm Var}(X)})^3}=n^{-1/2}\gamma_X. \]

我们可以用 Edgeworth 展开推导 NP 近似,但这不是严格的数学证明

假设理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 独立同分布,其均值为 \(\mu_X\) ,方差为 \(\sigma_X^2\) ,偏度为 \(\gamma_X\)

于是个体风险模型 \(S\) 的均值为 \(\mu_S=n\mu_X\) ,方差为 \(\sigma_S^2=n\sigma_X^2\) ,偏度为 \(\gamma_S=n^{-1/2}\gamma_X\)

定义 \(Z\) 为个体风险模型 \(S\) 的标准化随机变量,则有

\[Z=\frac{S-\mathbb{E}(S)}{\sqrt{{\rm Var}(S)}} , \quad \gamma_Z =\mathbb{E}\left(Z^3\right)=\gamma_S=\frac{\gamma_X}{\sqrt{n}}. \]

\(S\)\(Z\) 的偏度相等,并且和理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 的偏度 \(\gamma_X\) 满足上式关系。

\(Z\) 的累积量母函数,有

\[\begin{aligned} \log\mathbb{E}(e^{tZ})&=\mathbb{E}(Z)t+{\rm Var}(Z)\frac12t^2+\mathbb{E}\left[(Z-\mathbb{E}(Z))^3\right]\frac16t^3+\cdots \\ \\ &=\frac12t^2+\frac16\gamma_Z t^3+\cdots\\ \\ &=\frac12t^2+\frac16n^{-1/2}\gamma_Xt^3+\cdots. \end{aligned} \]

因此,对 \(Z\) 的矩母函数,有

\[\mathbb{E}(e^{tZ})=\exp\left\{\frac12t^2\right\}\exp\left\{\frac16n^{-1/2}\gamma_Xt^3+\cdots\right\}. \]

标准正态分布的分布函数 \(\Phi(x)\) 与密度函数 \(\phi(x)\) 及其导数的关系:

\[\begin{aligned} &\Phi'(x)=\phi(x), \\ \\ &\Phi''(x)=\phi'(x)=-x\phi(x), \\ \\ &\Phi^{(3)}(x)=\phi''(x)=(x^2-1)\phi(x), \\ \\ &\Phi^{(4)}(x)=\phi^{(3)}(x)=(3x-x^3)\phi(x). \end{aligned} \]

可以证明如下的关系式:

\[\begin{aligned} &\int_{-\infty}^\infty e^{tx}\phi^{(3)}(x)\mathrm{d}x=-t^3\exp\left\{\frac12t^2\right\}, \\ \\ &\int_{-\infty}^\infty e^{tx}\phi(x)\mathrm{d}x=\exp\left\{\frac12t^2\right\}. \end{aligned} \]

随机变量 \(Z\) 的分布函数的 Edgeworth 展开

\[\begin{aligned} F_Z(x)&=\Phi(x)-\frac16\gamma_Z\Phi^{(3)}(x)+\cdots \\ \\ &=\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)+\cdots \\ \\ &\approx\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x). \end{aligned} \]

最后一行称为随机变量 \(Z\) 的分布函数的 Edgeworth 近似

注意:当 \(x>1\) 时,\(\Phi^{(3)}(x)=(x^2-1)\phi(x)>0\) ,于是

\[\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)>0, \]

由此推出 \(F_Z(x)<\Phi(x)\) ,进而有尾部概率 \(\overline{F}_Z(x)>\overline\Phi(x)\) ,即采用 Edgeworth 近似所得到的尾部概率比中心极限定理计算出的值要大。

由于不能保证Edgeworth 近似是一个增函数,因此我们试图找到一个修正函数 \(\delta=\delta(s)\) ,使得

\[F_Z(s+\delta)\approx \Phi(s), \quad \delta>0. \]

这意味着我们需要找到辅助函数 \(g(\delta)\) 的零点来估计 \(\delta\) ,其中 \(g(\delta)\) 的定义为

\[\begin{aligned} g(\delta)&=\Phi(s)-F(s+\delta) \\ \\ &=\Phi(s)-\left[\Phi(s+\delta)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s+\delta)\right]. \end{aligned} \]

于是有

\[\begin{aligned} g(0)&=\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s), \\ \\ g'(0)&=-\Phi'(s)+\frac16n^{-1/2}\gamma_X\Phi^{(4)}(s). \end{aligned} \]

由 Taylor 展开 \(g(\delta)\approx g(0)+\delta g'(0)\) ,再令 \(g(\delta)\approx0\) 可得

\[\begin{aligned} \delta&\approx -\frac{g(0)}{g'(0)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X\Phi^{(3)}(s)}{-\Phi'(s)+\dfrac16n^{-1/2}\gamma_X\Phi^{(4)}(s)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X(s^2-1)\phi(s)}{\left[-1+\dfrac16n^{-1/2}\gamma_X(-s^3+3s)\right]\phi(s)} \\ \\ &\approx\dfrac16n^{-1/2}\gamma_X(s^2-1) \\ \\ &=\frac16\gamma_Z(s^2-1)=\frac16\gamma_S(s^2-1). \end{aligned} \]

所以当 \(\delta=\dfrac16\gamma_S(s^2-1)\) 时,\(F_Z(s+\delta)\approx\Phi(s)\) ,代入可得 NP 近似

\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq s+\frac{\gamma_S}{6}(s^2-1)\right]=F_Z\left(s+\frac{\gamma_S}6(s^2-1)\right)\approx \Phi(s). \]

四、案例

例如:假设总理赔支付 \(S\) 的均值为 \(10000\) ,标准差为 \(1000\) ,偏度为 \(1\)

(1) 计算资本量 \(13000\) 不足以弥补损失 \(S\) 的概率的近似值。

中心极限定理

\[\mathrm{Pr}(S>13000)\approx 1-\Phi\left(\frac{13000-10000}{1000}\right)=0.0013. \]

平移伽马近似

\[\alpha=4,\quad\beta=0.002,\quad x_0=8000, \\ \\ \begin{aligned} \mathrm{Pr}(S>13000)&\approx1-G(13000-8000;4,0.002) \\ \\ &=1-G(5000;4,0.002) \\ \\ &=1-G(0.5;4,20) \\ \\ &=0.0103. \end{aligned} \]

NP 近似

\[\begin{aligned} \mathrm{Pr}(S>13000)&=\mathrm{Pr}\left(\frac{S-10000}{1000}>3\right) \\ \\ &\approx1-\Phi\left(\sqrt{9+6\times3+1}-3\right) \\ \\ &=0.011. \end{aligned} \]

(2) 计算资本量,使得资本量以 \(95\%\) 的概率不小于理赔额 \(S\) 。标准正态分布 \(0.95\) 分位数为

\[\Phi(s)=0.95 \quad \iff \quad s=1.645. \]

中心极限定理

\[\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s\right]\approx\Phi(s)=0.95, \]

解得 \(S\)\(95\%\) 的分位点为

\[S_{(0.95)}\approx10000+1000\times1.645=11645. \]

NP 近似

\[\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s+\frac{1}{6}(s^2-1)\right]\approx\Phi(s)=0.95, \]

解得 \(S\)\(95\%\) 的分位点为

\[S_{(0.95)}\approx10000+1000\times\left(1.645+\frac16\left(1.645^2-1\right)\right)=11929. \]

例如:假设有 \(n=1000\) 个年轻男性购买了保险期限为一年的保单,每个投保人在一年内死亡的概率为 \(0.001\) ,且死亡发生的理赔支付为 \(1\) ,总理赔支付 \(S\) 服从二项分布 \(B(1000,0.001)\) 。求这批保单总理赔支付至少为 \(4\) 的概率。

二项分布(精确值)

\[\mathrm{Pr}(S\geq4)=0.01893. \]

泊松分布:由于这里 \(n=1000\) 非常大,\(p=0.001\) 非常小,根据泊松定理,我们可以用泊松分布 \(P(np)\) 来近似所求的概率。如果 \(S\sim P(1)\) ,则有

\[\mathrm{Pr}(S\geq4)=1-e^{-1}-e^{-1}-\frac12e^{-1}-\frac12e^{-1}=0.01899. \]

中心极限定理:由于正态分布是连续的,所以采用 \(x=3.5\) 估计尾部概率。

\[\mu_S=1000\times0.001=1,\quad \sigma_S=\displaystyle\sqrt{1000\times0.001\times 0.999}=0.9995 , \\ \\ \mathrm{Pr}(S\geq3.5)=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\approx1-\Phi(2.5)=0.0062. \]

可以看出,利用中心极限定理近似尾部概率的效果很差,估计出的尾部概率比精确值小很多。

平移伽马近似:由于平移伽马分布也是连续的,所以同样采用 \(x=3.5\) 估计尾部概率。这里我们仍然假设 \(S\sim P(1)\) ,则有 \(\mu_S=1,\ \sigma_S=1, \ \gamma_S=1\) ,于是

\[\alpha=4 , \quad \beta=2,\quad x_0=-1 \\ \\ \mathrm{Pr}(S\geq3.5)\approx1-G(3.5-(-1);4,2)=0.0212. \]

NP 近似

\[\begin{aligned} \mathrm{Pr}(S\geq3.5)&=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\\ \\ &\approx1-\Phi\left(\sqrt{9+6\times2.5+1}-3\right) \\ \\ &=1-\Phi(2) \\ \\ &=0.0228. \end{aligned} \]

posted @ 2022-03-06 19:33  这个XD很懒  阅读(1359)  评论(0编辑  收藏  举报