现代精算风险理论02：个体风险模型

第二讲个体风险模型
- 第一节个体风险模型的分布
  - 一、定义和相关说明
  - 二、卷积与变换
- 第二节近似分布

第二讲个体风险模型

第一节个体风险模型的分布

一、定义和相关说明

在个体风险模型中，我们感兴趣的是多份保单总理赔额的分布。首先给出其定义和相关说明。

设 \(X_1,X_2,\cdots,X_n\) 分别为 \(n\) 份保单的理赔额，假设理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 是相互独立的，定义个体风险模型为

\[S_n=X_1+X_2+\cdots+X_n. \]

个体风险模型又称为短期风险模型，即不考虑时间因素，保单总数 \(n\) 为非随机的风险模型。

从数学的角度看，总理赔额 \(S_n\) 是独立同分布的随机变量的和。我们的研究目标就是个体风险模型 \(S_n\) 的分布函数和数字特征等。

关于个体风险模型的一些说明：

一般非寿险保险的合同期往往较短，绝大多数是一年期。因此，通常不考虑货币的时间价值。但对于寿险来说，货币的时间价值是非常重要的。
独立性的假设在保险实务中往往是不满足的。例如同一建筑中不同楼层的火灾保险保单，那么这些保单风险相互之间是不独立的。同样，当某一自然灾害发生时，如地震、台风等，同一地区的各类人寿保险或财产保险的索赔风险也是相关的。
本章中我们总是假设理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 是相互独立的。

二、卷积与变换

卷积运算是通过两个独立随机变量 \(X\) 和 \(Y\) 的分布函数来计算它们的和 \(X+Y\) 的分布函数的计算方法：

\[\begin{aligned} F_{X+Y}(s)&=\mathrm{Pr}(X+Y\leq s) \\ \\ &=\int_{-\infty}^\infty\mathrm{Pr}(X+Y\leq s|X=x)\mathrm{d}F_X(x) \\ \\ &=\int_{-\infty}^\infty\mathrm{Pr}(Y\leq s-x)\mathrm{d}F_X(x) \\ \\ &=\int_{-\infty}^\infty F_Y(s-x)\mathrm{d}F_X(x) \\ \\ &\equiv F_X*F_Y(s). \end{aligned} \]

分布函数 \(F_X* F_Y(s)\) 称为分布函数 \(F_X(\cdot)\) 和 \(F_Y(\cdot)\) 的卷积，即为 \(X+Y\) 的分布函数 \(F_{X+Y}(s)\) 。

如果 \(X\) 和 \(Y\) 是离散型随机变量，用 \(f_X(\cdot)\) 和 \(f_Y(\cdot)\) 表示其概率分布列，则有

\[f_X*f_Y(s)=\sum_{x}f_Y(s-x)f_X(x), \]

其中求和是取遍所有使得 \(f_X(x)>0\) 的 \(x\) ，即随机变量 \(X\) 的所有可能取值。

如果 \(X\) 和 \(Y\) 是连续型随机变量，用 \(f_X(\cdot)\) 和 \(f_Y(\cdot)\) 表示其概率密度函数，则有

\[f_X*f_Y(s)=\int_{-\infty}^\infty f_Y(s-x)f_X(x)\mathrm{d}x. \]

注意：卷积运算满足交换律和结合律，即

\[F_X*F_Y(s)=F_Y*F_X(s) , \\ \\ \left(F_X*F_Y\right)*F_Z(s)=F_X*\left(F_Y*F_Z\right)(s)=F_X*F_Y*F_Z(s). \]

卷积运算可以用来计算个体风险模型总理赔额的分布函数：

如果理赔风险 \(X_i\) 的分布函数为 \(F_i(x)\ (i=1,2,\cdots,n)\) 且相互独立，则 \(S_n\) 的分布函数为

\[F_{S_n}(s)=F_1*F_2*\cdots*F_n(s). \]
进一步假设 \(F_i(x)=F(x) \ (i=1,2,\cdots,n)\) ，则 \(S_n\) 的分布函数为

\[F_{S_n}(s)=F*F\cdots*F(s)\equiv F^{*n}(s). \]
称为分布函数 \(F(x)\) 的 \(n\) 重卷积。

利用 Laplace 变换可以方便我们对卷积进行运算：

Laplace 变换：对于函数 \(f(t)\) ，如果积分

\[F(s)\equiv\int_0^\infty f(t)e^{-st}\mathrm{d}t<\infty, \]
则称 \(F(s)\) 为函数 \(f(t)\) 的 Laplace 变换，记为 \(F(s)=\mathcal{L}[f(t)]\) ；

也称 \(f(t)\) 为函数 \(F(s)\) 的 Laplace 逆变换，记为 \(f(t)=\mathcal{L}^{-1}[F(s)]\) 。
卷积定理：对于函数 \(f(t)\) 和 \(g(t)\) ，其卷积的 Laplace 变换为

\[\mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s), \]
其中 \(F(s)\) 和 \(G(s)\) 分别为 \(f(t)\) 和 \(g(t)\) 的 Laplace 变换。

例如：设随机变量 \(X\) 和 \(Y\) 分别服从 \(\Gamma(\alpha_1,\beta)\) 和 \(\Gamma(\alpha_2,\beta)\) ，其密度函数分别为 \(f(t)\) 和 \(g(t)\) ，利用 Laplace 变换可得

\[\begin{aligned} &F(s)=\mathcal{L}[f(t)]=\int_0^\infty\frac{\beta^{\alpha_1}}{\Gamma(\alpha_1)}t^{\alpha_1-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1}, \\ \\ &G(s)=\mathcal{L}[g(t)]=\int_0^\infty\frac{\beta^{\alpha_2}}{\Gamma(\alpha_2)}t^{\alpha_2-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_2}. \end{aligned} \]
由卷积定理可知

\[\mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s)=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1+\alpha_2}. \]
比较 \(\Gamma\) 分布的 Laplace 变换，可知 \(X+Y\) 仍服从 \(\Gamma\) 分布，参数为 \((\alpha_1+\alpha_2,\beta)\) 。

利用 Laplace 变换判断随机变量的方法，和矩母函数、特征函数的道理是一致的。

第二节近似分布

一、中心极限定理

在概率论的极限理论中，当样本量足够大时，我们可以用中心极限定理去近似随机变量的和的分布。首先我们回顾一下中心极限定理。

中心极限定理：设 \(X_1,X_2,\cdots,X_n\) 独立同分布，其共同的均值为 \(\mu\) ，方差为 \(\sigma^2<\infty\) ，则有

\[\lim_{n\to\infty}{\rm Pr}\left[\sum_{i=1}^nX_i\leq n\mu+s\sigma\sqrt{n}\right]=\Phi(x), \]

其中 \(\Phi(x)\) 为标准正态分布的分布函数。

基于上述结果，个体风险模型 \(S_n\) 的近似分布可以表示为

\[F_S(s)\approx \Phi\left(s;n\mu,n\sigma^2\right). \]

然而，中心极限定理并不适用于损失分布的近似。这是因为保险风险往往是尾部较重的风险，用正态分布来近似随机变量的和的分布，特别是对尾部概率的近似，并不能够很好的符合实际情况。

在进行精算分析时，对尾部概率的近似估计往往愿意采用保守的估计，即和精确值比较接近，可以略大于精确值。常用的两种近似分布是平移伽马近似和正态幂阶近似。

二、平移伽马近似

选择平移伽马分布作为损失分布的近似分布，主要原因是大多数非寿险保单的理赔分布近似伽马分布，其特点为右偏态，取值非负，且具有单峰性。

一般伽马分布有 \(\alpha\) 和 \(\beta\) 两个参数，\(\Gamma(\alpha,\beta)\) 的密度函数为

\[f(x;\alpha,\beta)=\frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} , \quad x>0. \]

若 \(Z\sim \Gamma(\alpha,\beta)\) ，则 \(Z\) 的均值、方差和偏度分别为

\[\mathbb{E}(Z)=\frac{\alpha}{\beta},\quad {\rm Var}(Z)=\frac{\alpha}{\beta^2},\quad \gamma_Z=\frac{3}{\sqrt{\alpha}}. \]

平移伽马分布引入了第三个参数——偏移 \(x_0\) ，即采用 \(Z+x_0\) 的分布作为损失分布 \(S\) 的近似，

\[S\stackrel{d}{\approx}Z+x_0, \\ \\ F_S(s)\approx \mathrm{Pr}(Z+x_0\leq s)=G(s-x_0;\alpha,\beta), \]

其中 \(G(x;\alpha,\beta)\) 是 \(\Gamma(\alpha,\beta)\) 的分布函数。

平移伽马分布的均值、方差和偏度分别为

\[\mathbb{E}(Z+x_0)=x_0+\frac\alpha\beta , \quad {\rm Var}(Z+x_0)=\frac\alpha{\beta^2},\quad \gamma_{Z+x_0}=\frac{2}{\sqrt{\alpha}}. \]

如果已知损失 \(S\) 的均值、方差和偏度分别为 \(\mu_S,\sigma_S^2\) 和 \(\gamma_S\) 。如果我们采用两个分布对应的前三阶矩相同的方式给出近似分布，则 \(\alpha,\beta\) 和 \(x_0\) 的选取需要满足如下的方程：

\[\begin{aligned} &\mu_S=\mathbb{E}(Z+x_0)=x_0+\frac\alpha\beta, \\ \\ &\sigma_S^2={\rm Var}(Z+x_0)=\frac\alpha{\beta^2}, \\ \\ &\gamma_S=\gamma_{Z+x_0}=\frac{2}{\sqrt{\alpha}}. \end{aligned} \]

解方程可得

\[\alpha=\frac{4}{\gamma_S^2}, \quad \beta=\frac{2}{\gamma_S\sigma_S},\quad x_0=\mu_S-\frac{2\sigma_S}{\gamma_S}. \]

注意：

为使这种近似方法有效，偏度必须严格为正值，即 \(\gamma_S>0\) 。若 \(\gamma_S\to0\) ，则与正态近似接近。
如果两个分布函数的前三阶矩相同，则彼此之间的差异不会太大。
虽然没有类似中心极限定理一样精确的理论证明，但实际经验发现，大多数损失分布采用平移伽马分布作为近似有较好的效果。

三、正态幂阶近似

另一种损失分布的近似方法是正态幂阶近似，又称为 NP 近似，它也是一种使用近似随机变量前三阶矩的近似方法，要求损失分布的矩母函数存在。

如果已知 \(\mathbb{E}(S)=\mu_S,\ {\rm Var}(S)=\sigma_S^2\) 以及偏度 \(\gamma_S\) ，则当 \(s\geq1\) 时，

\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq s+\frac{\gamma_S}{6}(s^2-1)\right]\approx\Phi(s). \]

或等价地，当 \(x\geq1\) 时，

\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq x\right]\approx\Phi\left(\sqrt{\frac{9}{\gamma_S^2}+\frac{6x}{\gamma_S}+1}-\frac{3}{\gamma_S}\right). \]

一般地，第一个公式可以得到近似 \(S\) 的分位数，第二个公式可以得到近似 \(S\) 的分布函数。

引理：设 \(X_i\ (i=1,2,\cdots,n)\) 是独立同分布的随机变量，其偏度为 \(\gamma_X\) ，定义随机变量

\[S=X_1+X_2+\cdots+X_n, \]
则 \(S\) 的偏度为

\[\gamma_S=n^{-1/2}\gamma_X. \]
首先计算 \(S\) 的前三阶矩：

\[\begin{aligned} &\mathbb{E}(S)=n\mathbb{E}(X), \\ \\ &{\rm Var}(S)=n{\rm Var}(X) , \\ \\ &\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]=\mathbb{E}\left[\sum_{i=1}^n(X_i-\mathbb{E}(X_i))\right]^3=n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]. \end{aligned} \]
所以

\[\gamma_S=\frac{\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]}{(\sqrt{{\rm Var}(S)})^3}=\frac{n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]}{(\sqrt{n{\rm Var}(X)})^3}=n^{-1/2}\gamma_X. \]

我们可以用 Edgeworth 展开推导 NP 近似，但这不是严格的数学证明。

假设理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 独立同分布，其均值为 \(\mu_X\) ，方差为 \(\sigma_X^2\) ，偏度为 \(\gamma_X\) 。

于是个体风险模型 \(S\) 的均值为 \(\mu_S=n\mu_X\) ，方差为 \(\sigma_S^2=n\sigma_X^2\) ，偏度为 \(\gamma_S=n^{-1/2}\gamma_X\) 。

定义 \(Z\) 为个体风险模型 \(S\) 的标准化随机变量，则有

\[Z=\frac{S-\mathbb{E}(S)}{\sqrt{{\rm Var}(S)}} , \quad \gamma_Z =\mathbb{E}\left(Z^3\right)=\gamma_S=\frac{\gamma_X}{\sqrt{n}}. \]
即 \(S\) 和 \(Z\) 的偏度相等，并且和理赔风险 \(X_i\ (i=1,2,\cdots,n)\) 的偏度 \(\gamma_X\) 满足上式关系。

对 \(Z\) 的累积量母函数，有

\[\begin{aligned} \log\mathbb{E}(e^{tZ})&=\mathbb{E}(Z)t+{\rm Var}(Z)\frac12t^2+\mathbb{E}\left[(Z-\mathbb{E}(Z))^3\right]\frac16t^3+\cdots \\ \\ &=\frac12t^2+\frac16\gamma_Z t^3+\cdots\\ \\ &=\frac12t^2+\frac16n^{-1/2}\gamma_Xt^3+\cdots. \end{aligned} \]
因此，对 \(Z\) 的矩母函数，有

\[\mathbb{E}(e^{tZ})=\exp\left\{\frac12t^2\right\}\exp\left\{\frac16n^{-1/2}\gamma_Xt^3+\cdots\right\}. \]
标准正态分布的分布函数 \(\Phi(x)\) 与密度函数 \(\phi(x)\) 及其导数的关系：

\[\begin{aligned} &\Phi'(x)=\phi(x), \\ \\ &\Phi''(x)=\phi'(x)=-x\phi(x), \\ \\ &\Phi^{(3)}(x)=\phi''(x)=(x^2-1)\phi(x), \\ \\ &\Phi^{(4)}(x)=\phi^{(3)}(x)=(3x-x^3)\phi(x). \end{aligned} \]
可以证明如下的关系式：

\[\begin{aligned} &\int_{-\infty}^\infty e^{tx}\phi^{(3)}(x)\mathrm{d}x=-t^3\exp\left\{\frac12t^2\right\}, \\ \\ &\int_{-\infty}^\infty e^{tx}\phi(x)\mathrm{d}x=\exp\left\{\frac12t^2\right\}. \end{aligned} \]
随机变量 \(Z\) 的分布函数的 Edgeworth 展开

\[\begin{aligned} F_Z(x)&=\Phi(x)-\frac16\gamma_Z\Phi^{(3)}(x)+\cdots \\ \\ &=\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)+\cdots \\ \\ &\approx\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x). \end{aligned} \]
最后一行称为随机变量 \(Z\) 的分布函数的 Edgeworth 近似。

注意：当 \(x>1\) 时，\(\Phi^{(3)}(x)=(x^2-1)\phi(x)>0\) ，于是

\[\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)>0, \]
由此推出 \(F_Z(x)<\Phi(x)\) ，进而有尾部概率 \(\overline{F}_Z(x)>\overline\Phi(x)\) ，即采用 Edgeworth 近似所得到的尾部概率比中心极限定理计算出的值要大。

由于不能保证Edgeworth 近似是一个增函数，因此我们试图找到一个修正函数 \(\delta=\delta(s)\) ，使得

\[F_Z(s+\delta)\approx \Phi(s), \quad \delta>0. \]
这意味着我们需要找到辅助函数 \(g(\delta)\) 的零点来估计 \(\delta\) ，其中 \(g(\delta)\) 的定义为

\[\begin{aligned} g(\delta)&=\Phi(s)-F(s+\delta) \\ \\ &=\Phi(s)-\left[\Phi(s+\delta)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s+\delta)\right]. \end{aligned} \]
于是有

\[\begin{aligned} g(0)&=\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s), \\ \\ g'(0)&=-\Phi'(s)+\frac16n^{-1/2}\gamma_X\Phi^{(4)}(s). \end{aligned} \]
由 Taylor 展开 \(g(\delta)\approx g(0)+\delta g'(0)\) ，再令 \(g(\delta)\approx0\) 可得

\[\begin{aligned} \delta&\approx -\frac{g(0)}{g'(0)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X\Phi^{(3)}(s)}{-\Phi'(s)+\dfrac16n^{-1/2}\gamma_X\Phi^{(4)}(s)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X(s^2-1)\phi(s)}{\left[-1+\dfrac16n^{-1/2}\gamma_X(-s^3+3s)\right]\phi(s)} \\ \\ &\approx\dfrac16n^{-1/2}\gamma_X(s^2-1) \\ \\ &=\frac16\gamma_Z(s^2-1)=\frac16\gamma_S(s^2-1). \end{aligned} \]
所以当 \(\delta=\dfrac16\gamma_S(s^2-1)\) 时，\(F_Z(s+\delta)\approx\Phi(s)\) ，代入可得 NP 近似

\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq s+\frac{\gamma_S}{6}(s^2-1)\right]=F_Z\left(s+\frac{\gamma_S}6(s^2-1)\right)\approx \Phi(s). \]

四、案例

例如：假设总理赔支付 \(S\) 的均值为 \(10000\) ，标准差为 \(1000\) ，偏度为 \(1\) 。

(1) 计算资本量 \(13000\) 不足以弥补损失 \(S\) 的概率的近似值。

中心极限定理：

\[\mathrm{Pr}(S>13000)\approx 1-\Phi\left(\frac{13000-10000}{1000}\right)=0.0013. \]
平移伽马近似：

\[\alpha=4,\quad\beta=0.002,\quad x_0=8000, \\ \\ \begin{aligned} \mathrm{Pr}(S>13000)&\approx1-G(13000-8000;4,0.002) \\ \\ &=1-G(5000;4,0.002) \\ \\ &=1-G(0.5;4,20) \\ \\ &=0.0103. \end{aligned} \]
NP 近似：

\[\begin{aligned} \mathrm{Pr}(S>13000)&=\mathrm{Pr}\left(\frac{S-10000}{1000}>3\right) \\ \\ &\approx1-\Phi\left(\sqrt{9+6\times3+1}-3\right) \\ \\ &=0.011. \end{aligned} \]
(2) 计算资本量，使得资本量以 \(95\%\) 的概率不小于理赔额 \(S\) 。标准正态分布 \(0.95\) 分位数为

\[\Phi(s)=0.95 \quad \iff \quad s=1.645. \]
中心极限定理：

\[\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s\right]\approx\Phi(s)=0.95, \]
解得 \(S\) 的 \(95\%\) 的分位点为

\[S_{(0.95)}\approx10000+1000\times1.645=11645. \]
NP 近似：

\[\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s+\frac{1}{6}(s^2-1)\right]\approx\Phi(s)=0.95, \]
解得 \(S\) 的 \(95\%\) 的分位点为

\[S_{(0.95)}\approx10000+1000\times\left(1.645+\frac16\left(1.645^2-1\right)\right)=11929. \]

例如：假设有 \(n=1000\) 个年轻男性购买了保险期限为一年的保单，每个投保人在一年内死亡的概率为 \(0.001\) ，且死亡发生的理赔支付为 \(1\) ，总理赔支付 \(S\) 服从二项分布 \(B(1000,0.001)\) 。求这批保单总理赔支付至少为 \(4\) 的概率。

二项分布（精确值）：

\[\mathrm{Pr}(S\geq4)=0.01893. \]
泊松分布：由于这里 \(n=1000\) 非常大，\(p=0.001\) 非常小，根据泊松定理，我们可以用泊松分布 \(P(np)\) 来近似所求的概率。如果 \(S\sim P(1)\) ，则有

\[\mathrm{Pr}(S\geq4)=1-e^{-1}-e^{-1}-\frac12e^{-1}-\frac12e^{-1}=0.01899. \]
中心极限定理：由于正态分布是连续的，所以采用 \(x=3.5\) 估计尾部概率。

\[\mu_S=1000\times0.001=1,\quad \sigma_S=\displaystyle\sqrt{1000\times0.001\times 0.999}=0.9995 , \\ \\ \mathrm{Pr}(S\geq3.5)=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\approx1-\Phi(2.5)=0.0062. \]
可以看出，利用中心极限定理近似尾部概率的效果很差，估计出的尾部概率比精确值小很多。

平移伽马近似：由于平移伽马分布也是连续的，所以同样采用 \(x=3.5\) 估计尾部概率。这里我们仍然假设 \(S\sim P(1)\) ，则有 \(\mu_S=1,\ \sigma_S=1, \ \gamma_S=1\) ，于是

\[\alpha=4 , \quad \beta=2,\quad x_0=-1 \\ \\ \mathrm{Pr}(S\geq3.5)\approx1-G(3.5-(-1);4,2)=0.0212. \]
NP 近似：

\[\begin{aligned} \mathrm{Pr}(S\geq3.5)&=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\\ \\ &\approx1-\Phi\left(\sqrt{9+6\times2.5+1}-3\right) \\ \\ &=1-\Phi(2) \\ \\ &=0.0228. \end{aligned} \]

posted @ 2022-03-06 19:33 这个XD很懒阅读(1359) 评论(0) 编辑收藏举报

刷新页面返回顶部

这个XD很懒