现代精算风险理论02:个体风险模型
第二讲 个体风险模型
第一节 个体风险模型的分布
一、定义和相关说明
在个体风险模型中,我们感兴趣的是多份保单总理赔额的分布。首先给出其定义和相关说明。
设 \(X_1,X_2,\cdots,X_n\) 分别为 \(n\) 份保单的理赔额,假设理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 是相互独立的,定义个体风险模型为
个体风险模型又称为短期风险模型,即不考虑时间因素,保单总数 \(n\) 为非随机的风险模型。
从数学的角度看,总理赔额 \(S_n\) 是独立同分布的随机变量的和。我们的研究目标就是个体风险模型 \(S_n\) 的分布函数和数字特征等。
关于个体风险模型的一些说明:
- 一般非寿险保险的合同期往往较短,绝大多数是一年期。因此,通常不考虑货币的时间价值。但对于寿险来说,货币的时间价值是非常重要的。
- 独立性的假设在保险实务中往往是不满足的。例如同一建筑中不同楼层的火灾保险保单,那么这些保单风险相互之间是不独立的。同样,当某一自然灾害发生时,如地震、台风等,同一地区的各类人寿保险或财产保险的索赔风险也是相关的。
- 本章中我们总是假设理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 是相互独立的。
二、卷积与变换
卷积运算是通过两个独立随机变量 \(X\) 和 \(Y\) 的分布函数来计算它们的和 \(X+Y\) 的分布函数的计算方法:
分布函数 \(F_X* F_Y(s)\) 称为分布函数 \(F_X(\cdot)\) 和 \(F_Y(\cdot)\) 的卷积,即为 \(X+Y\) 的分布函数 \(F_{X+Y}(s)\) 。
如果 \(X\) 和 \(Y\) 是离散型随机变量,用 \(f_X(\cdot)\) 和 \(f_Y(\cdot)\) 表示其概率分布列,则有
其中求和是取遍所有使得 \(f_X(x)>0\) 的 \(x\) ,即随机变量 \(X\) 的所有可能取值。
如果 \(X\) 和 \(Y\) 是连续型随机变量,用 \(f_X(\cdot)\) 和 \(f_Y(\cdot)\) 表示其概率密度函数,则有
注意:卷积运算满足交换律和结合律,即
卷积运算可以用来计算个体风险模型总理赔额的分布函数:
-
如果理赔风险 \(X_i\) 的分布函数为 \(F_i(x)\ (i=1,2,\cdots,n)\) 且相互独立,则 \(S_n\) 的分布函数为
\[F_{S_n}(s)=F_1*F_2*\cdots*F_n(s). \] -
进一步假设 \(F_i(x)=F(x) \ (i=1,2,\cdots,n)\) ,则 \(S_n\) 的分布函数为
\[F_{S_n}(s)=F*F\cdots*F(s)\equiv F^{*n}(s). \]称为分布函数 \(F(x)\) 的 \(n\) 重卷积。
利用 Laplace 变换可以方便我们对卷积进行运算:
-
Laplace 变换:对于函数 \(f(t)\) ,如果积分
\[F(s)\equiv\int_0^\infty f(t)e^{-st}\mathrm{d}t<\infty, \]则称 \(F(s)\) 为函数 \(f(t)\) 的 Laplace 变换,记为 \(F(s)=\mathcal{L}[f(t)]\) ;
也称 \(f(t)\) 为函数 \(F(s)\) 的 Laplace 逆变换,记为 \(f(t)=\mathcal{L}^{-1}[F(s)]\) 。
-
卷积定理:对于函数 \(f(t)\) 和 \(g(t)\) ,其卷积的 Laplace 变换为
\[\mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s), \]其中 \(F(s)\) 和 \(G(s)\) 分别为 \(f(t)\) 和 \(g(t)\) 的 Laplace 变换。
例如:设随机变量 \(X\) 和 \(Y\) 分别服从 \(\Gamma(\alpha_1,\beta)\) 和 \(\Gamma(\alpha_2,\beta)\) ,其密度函数分别为 \(f(t)\) 和 \(g(t)\) ,利用 Laplace 变换可得
\[\begin{aligned} &F(s)=\mathcal{L}[f(t)]=\int_0^\infty\frac{\beta^{\alpha_1}}{\Gamma(\alpha_1)}t^{\alpha_1-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1}, \\ \\ &G(s)=\mathcal{L}[g(t)]=\int_0^\infty\frac{\beta^{\alpha_2}}{\Gamma(\alpha_2)}t^{\alpha_2-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_2}. \end{aligned} \]由卷积定理可知
\[\mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s)=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1+\alpha_2}. \]比较 \(\Gamma\) 分布的 Laplace 变换,可知 \(X+Y\) 仍服从 \(\Gamma\) 分布,参数为 \((\alpha_1+\alpha_2,\beta)\) 。
利用 Laplace 变换判断随机变量的方法,和矩母函数、特征函数的道理是一致的。
第二节 近似分布
一、中心极限定理
在概率论的极限理论中,当样本量足够大时,我们可以用中心极限定理去近似随机变量的和的分布。首先我们回顾一下中心极限定理。
中心极限定理:设 \(X_1,X_2,\cdots,X_n\) 独立同分布,其共同的均值为 \(\mu\) ,方差为 \(\sigma^2<\infty\) ,则有
其中 \(\Phi(x)\) 为标准正态分布的分布函数。
基于上述结果,个体风险模型 \(S_n\) 的近似分布可以表示为
然而,中心极限定理并不适用于损失分布的近似。这是因为保险风险往往是尾部较重的风险,用正态分布来近似随机变量的和的分布,特别是对尾部概率的近似,并不能够很好的符合实际情况。
在进行精算分析时,对尾部概率的近似估计往往愿意采用保守的估计,即和精确值比较接近,可以略大于精确值。常用的两种近似分布是平移伽马近似和正态幂阶近似。
二、平移伽马近似
选择平移伽马分布作为损失分布的近似分布,主要原因是大多数非寿险保单的理赔分布近似伽马分布,其特点为右偏态,取值非负,且具有单峰性。
一般伽马分布有 \(\alpha\) 和 \(\beta\) 两个参数,\(\Gamma(\alpha,\beta)\) 的密度函数为
若 \(Z\sim \Gamma(\alpha,\beta)\) ,则 \(Z\) 的均值、方差和偏度分别为
平移伽马分布引入了第三个参数——偏移 \(x_0\) ,即采用 \(Z+x_0\) 的分布作为损失分布 \(S\) 的近似,
其中 \(G(x;\alpha,\beta)\) 是 \(\Gamma(\alpha,\beta)\) 的分布函数。
平移伽马分布的均值、方差和偏度分别为
如果已知损失 \(S\) 的均值、方差和偏度分别为 \(\mu_S,\sigma_S^2\) 和 \(\gamma_S\) 。如果我们采用两个分布对应的前三阶矩相同的方式给出近似分布,则 \(\alpha,\beta\) 和 \(x_0\) 的选取需要满足如下的方程:
解方程可得
注意:
- 为使这种近似方法有效,偏度必须严格为正值,即 \(\gamma_S>0\) 。若 \(\gamma_S\to0\) ,则与正态近似接近。
- 如果两个分布函数的前三阶矩相同,则彼此之间的差异不会太大。
- 虽然没有类似中心极限定理一样精确的理论证明,但实际经验发现,大多数损失分布采用平移伽马分布作为近似有较好的效果。
三、正态幂阶近似
另一种损失分布的近似方法是正态幂阶近似,又称为 NP 近似,它也是一种使用近似随机变量前三阶矩的近似方法,要求损失分布的矩母函数存在。
如果已知 \(\mathbb{E}(S)=\mu_S,\ {\rm Var}(S)=\sigma_S^2\) 以及偏度 \(\gamma_S\) ,则当 \(s\geq1\) 时,
或等价地,当 \(x\geq1\) 时,
一般地,第一个公式可以得到近似 \(S\) 的分位数,第二个公式可以得到近似 \(S\) 的分布函数。
引理:设 \(X_i\ (i=1,2,\cdots,n)\) 是独立同分布的随机变量,其偏度为 \(\gamma_X\) ,定义随机变量
\[S=X_1+X_2+\cdots+X_n, \]则 \(S\) 的偏度为
\[\gamma_S=n^{-1/2}\gamma_X. \]首先计算 \(S\) 的前三阶矩:
\[\begin{aligned} &\mathbb{E}(S)=n\mathbb{E}(X), \\ \\ &{\rm Var}(S)=n{\rm Var}(X) , \\ \\ &\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]=\mathbb{E}\left[\sum_{i=1}^n(X_i-\mathbb{E}(X_i))\right]^3=n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]. \end{aligned} \]所以
\[\gamma_S=\frac{\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]}{(\sqrt{{\rm Var}(S)})^3}=\frac{n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]}{(\sqrt{n{\rm Var}(X)})^3}=n^{-1/2}\gamma_X. \]
我们可以用 Edgeworth 展开推导 NP 近似,但这不是严格的数学证明。
假设理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 独立同分布,其均值为 \(\mu_X\) ,方差为 \(\sigma_X^2\) ,偏度为 \(\gamma_X\) 。
于是个体风险模型 \(S\) 的均值为 \(\mu_S=n\mu_X\) ,方差为 \(\sigma_S^2=n\sigma_X^2\) ,偏度为 \(\gamma_S=n^{-1/2}\gamma_X\) 。
定义 \(Z\) 为个体风险模型 \(S\) 的标准化随机变量,则有
\[Z=\frac{S-\mathbb{E}(S)}{\sqrt{{\rm Var}(S)}} , \quad \gamma_Z =\mathbb{E}\left(Z^3\right)=\gamma_S=\frac{\gamma_X}{\sqrt{n}}. \]即 \(S\) 和 \(Z\) 的偏度相等,并且和理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 的偏度 \(\gamma_X\) 满足上式关系。
对 \(Z\) 的累积量母函数,有
\[\begin{aligned} \log\mathbb{E}(e^{tZ})&=\mathbb{E}(Z)t+{\rm Var}(Z)\frac12t^2+\mathbb{E}\left[(Z-\mathbb{E}(Z))^3\right]\frac16t^3+\cdots \\ \\ &=\frac12t^2+\frac16\gamma_Z t^3+\cdots\\ \\ &=\frac12t^2+\frac16n^{-1/2}\gamma_Xt^3+\cdots. \end{aligned} \]因此,对 \(Z\) 的矩母函数,有
\[\mathbb{E}(e^{tZ})=\exp\left\{\frac12t^2\right\}\exp\left\{\frac16n^{-1/2}\gamma_Xt^3+\cdots\right\}. \]标准正态分布的分布函数 \(\Phi(x)\) 与密度函数 \(\phi(x)\) 及其导数的关系:
\[\begin{aligned} &\Phi'(x)=\phi(x), \\ \\ &\Phi''(x)=\phi'(x)=-x\phi(x), \\ \\ &\Phi^{(3)}(x)=\phi''(x)=(x^2-1)\phi(x), \\ \\ &\Phi^{(4)}(x)=\phi^{(3)}(x)=(3x-x^3)\phi(x). \end{aligned} \]可以证明如下的关系式:
\[\begin{aligned} &\int_{-\infty}^\infty e^{tx}\phi^{(3)}(x)\mathrm{d}x=-t^3\exp\left\{\frac12t^2\right\}, \\ \\ &\int_{-\infty}^\infty e^{tx}\phi(x)\mathrm{d}x=\exp\left\{\frac12t^2\right\}. \end{aligned} \]随机变量 \(Z\) 的分布函数的 Edgeworth 展开
\[\begin{aligned} F_Z(x)&=\Phi(x)-\frac16\gamma_Z\Phi^{(3)}(x)+\cdots \\ \\ &=\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)+\cdots \\ \\ &\approx\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x). \end{aligned} \]最后一行称为随机变量 \(Z\) 的分布函数的 Edgeworth 近似。
注意:当 \(x>1\) 时,\(\Phi^{(3)}(x)=(x^2-1)\phi(x)>0\) ,于是
\[\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)>0, \]由此推出 \(F_Z(x)<\Phi(x)\) ,进而有尾部概率 \(\overline{F}_Z(x)>\overline\Phi(x)\) ,即采用 Edgeworth 近似所得到的尾部概率比中心极限定理计算出的值要大。
由于不能保证Edgeworth 近似是一个增函数,因此我们试图找到一个修正函数 \(\delta=\delta(s)\) ,使得
\[F_Z(s+\delta)\approx \Phi(s), \quad \delta>0. \]这意味着我们需要找到辅助函数 \(g(\delta)\) 的零点来估计 \(\delta\) ,其中 \(g(\delta)\) 的定义为
\[\begin{aligned} g(\delta)&=\Phi(s)-F(s+\delta) \\ \\ &=\Phi(s)-\left[\Phi(s+\delta)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s+\delta)\right]. \end{aligned} \]于是有
\[\begin{aligned} g(0)&=\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s), \\ \\ g'(0)&=-\Phi'(s)+\frac16n^{-1/2}\gamma_X\Phi^{(4)}(s). \end{aligned} \]由 Taylor 展开 \(g(\delta)\approx g(0)+\delta g'(0)\) ,再令 \(g(\delta)\approx0\) 可得
\[\begin{aligned} \delta&\approx -\frac{g(0)}{g'(0)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X\Phi^{(3)}(s)}{-\Phi'(s)+\dfrac16n^{-1/2}\gamma_X\Phi^{(4)}(s)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X(s^2-1)\phi(s)}{\left[-1+\dfrac16n^{-1/2}\gamma_X(-s^3+3s)\right]\phi(s)} \\ \\ &\approx\dfrac16n^{-1/2}\gamma_X(s^2-1) \\ \\ &=\frac16\gamma_Z(s^2-1)=\frac16\gamma_S(s^2-1). \end{aligned} \]所以当 \(\delta=\dfrac16\gamma_S(s^2-1)\) 时,\(F_Z(s+\delta)\approx\Phi(s)\) ,代入可得 NP 近似
\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq s+\frac{\gamma_S}{6}(s^2-1)\right]=F_Z\left(s+\frac{\gamma_S}6(s^2-1)\right)\approx \Phi(s). \]
四、案例
例如:假设总理赔支付 \(S\) 的均值为 \(10000\) ,标准差为 \(1000\) ,偏度为 \(1\) 。
(1) 计算资本量 \(13000\) 不足以弥补损失 \(S\) 的概率的近似值。
中心极限定理:
\[\mathrm{Pr}(S>13000)\approx 1-\Phi\left(\frac{13000-10000}{1000}\right)=0.0013. \]平移伽马近似:
\[\alpha=4,\quad\beta=0.002,\quad x_0=8000, \\ \\ \begin{aligned} \mathrm{Pr}(S>13000)&\approx1-G(13000-8000;4,0.002) \\ \\ &=1-G(5000;4,0.002) \\ \\ &=1-G(0.5;4,20) \\ \\ &=0.0103. \end{aligned} \]NP 近似:
\[\begin{aligned} \mathrm{Pr}(S>13000)&=\mathrm{Pr}\left(\frac{S-10000}{1000}>3\right) \\ \\ &\approx1-\Phi\left(\sqrt{9+6\times3+1}-3\right) \\ \\ &=0.011. \end{aligned} \](2) 计算资本量,使得资本量以 \(95\%\) 的概率不小于理赔额 \(S\) 。标准正态分布 \(0.95\) 分位数为
\[\Phi(s)=0.95 \quad \iff \quad s=1.645. \]中心极限定理:
\[\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s\right]\approx\Phi(s)=0.95, \]解得 \(S\) 的 \(95\%\) 的分位点为
\[S_{(0.95)}\approx10000+1000\times1.645=11645. \]NP 近似:
\[\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s+\frac{1}{6}(s^2-1)\right]\approx\Phi(s)=0.95, \]解得 \(S\) 的 \(95\%\) 的分位点为
\[S_{(0.95)}\approx10000+1000\times\left(1.645+\frac16\left(1.645^2-1\right)\right)=11929. \]
例如:假设有 \(n=1000\) 个年轻男性购买了保险期限为一年的保单,每个投保人在一年内死亡的概率为 \(0.001\) ,且死亡发生的理赔支付为 \(1\) ,总理赔支付 \(S\) 服从二项分布 \(B(1000,0.001)\) 。求这批保单总理赔支付至少为 \(4\) 的概率。
二项分布(精确值):
\[\mathrm{Pr}(S\geq4)=0.01893. \]泊松分布:由于这里 \(n=1000\) 非常大,\(p=0.001\) 非常小,根据泊松定理,我们可以用泊松分布 \(P(np)\) 来近似所求的概率。如果 \(S\sim P(1)\) ,则有
\[\mathrm{Pr}(S\geq4)=1-e^{-1}-e^{-1}-\frac12e^{-1}-\frac12e^{-1}=0.01899. \]中心极限定理:由于正态分布是连续的,所以采用 \(x=3.5\) 估计尾部概率。
\[\mu_S=1000\times0.001=1,\quad \sigma_S=\displaystyle\sqrt{1000\times0.001\times 0.999}=0.9995 , \\ \\ \mathrm{Pr}(S\geq3.5)=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\approx1-\Phi(2.5)=0.0062. \]可以看出,利用中心极限定理近似尾部概率的效果很差,估计出的尾部概率比精确值小很多。
平移伽马近似:由于平移伽马分布也是连续的,所以同样采用 \(x=3.5\) 估计尾部概率。这里我们仍然假设 \(S\sim P(1)\) ,则有 \(\mu_S=1,\ \sigma_S=1, \ \gamma_S=1\) ,于是
\[\alpha=4 , \quad \beta=2,\quad x_0=-1 \\ \\ \mathrm{Pr}(S\geq3.5)\approx1-G(3.5-(-1);4,2)=0.0212. \]NP 近似:
\[\begin{aligned} \mathrm{Pr}(S\geq3.5)&=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\\ \\ &\approx1-\Phi\left(\sqrt{9+6\times2.5+1}-3\right) \\ \\ &=1-\Phi(2) \\ \\ &=0.0228. \end{aligned} \]