应用随机过程 | 期末知识点总结
这篇博客是「应用随机过程」的知识点总结。
本站相关博客:
特别鸣谢:
1 马尔可夫链的计算题
题型:
- 不变分布:
,求 π。 - 求
。- 原式
。
- 原式
- ① 求
。② 求 。- 先求 不变分布
, - 然后,不难验证 X 不可约非周期(
), - 所以,① 极限分布即为不变分布,② 原式
,所以 。
- 先求 不变分布
2 常返的马尔可夫链
一些辅助定义:
- 首达时:从 i 出发首次到达 j 的时间,定义为
。若到达不了 j,则是无穷。 - 首达概率:从 i 出发经 n 步首次到达 j 的概率,定义为
。 - 有限步首达概率:从 i 出发经有限步首次到达 j 的概率,定义为
。 - 平均回转时间:从 i 出发再回到 i 的平均时间,
。
常返:
- 常返:从状态 i 出发,最终返回状态 i 的概率是 1,但期望返回时间
可以为正无穷(零常返)。 - 正常返:从状态 i 出发,最终返回状态 i 的概率是 1,且期望返回时间
有限。 - 常返 / 正常返条件:
- 常返状态:
,即总能回到状态 i 。 ,发散 / 不收敛。
- 正常返状态:
,即 ,返回时间的期望是有限的。- i 已经是常返状态,且
,即返回时间的期望是有限的。 :因为在长期内,状态 i 被访问的频率与其期望返回时间成反比。
- 零常返状态:
,即 ,返回时间的期望是无穷。- i 已经是常返状态,且
,即返回时间的期望是无穷。
- 常返状态:
题型:
- 0 →1 → … → n → 0 的常返,使用
,写出每条最终返回 0 的轨迹 + 马尔科夫链显然不可约。 - 随机游走的常返【背过】。
3 连续时间参数的马尔可夫链
必要的定义:
- Q 矩阵:
,表示转移出状态 i 的速率。 是小于等于 0 的数,因为如果 t 时刻的 X = i,t + Δt 时刻的 X 肯定会往外转移(小于等于 0),而非继续往 X 转移(大于 0)。所以,Q 矩阵的对角线元素应该都是负的。- Q 矩阵每一行加起来 = 0。离散马尔可夫的 P 矩阵每一行加起来 = 1。
- (
,这是转移走的时间的分布;保留在 X = i 的期望时间长度是 ,保留的期望概率是指数分布 ,如果 X ≠ i 了,那么转移去状态 j 的概率是 。
- K 向前方程:
(P 在前面),向后方程: (P 在后面)。
题型:
-
证明 K 向前方程:
-
-
证明 K 向后方程:
-
-
证明(好像是任意)连续时间参数的马尔科夫链 一致连续:【背过】
-
需要证明的结论:
。 -
证 ≤:
-
-
此时,第一项 ≥ 0,第二项也 ≥ 0。放掉第二项,式子会变大;放掉第一项,式子会变小。
-
放掉第二项:原式
,得证。 -
证 ≥:
-
放掉第一项:原式
,得证。
-
-
定义
,即在状态 停留的时间。有 , (状态空间 )。写出 K 向前方程,并求解得到表达式。-
立得
。写出 K 向前方程: -
-
然后展开,进行微分方程求解。进行替换,
, 。最后求解的形式为: -
-
4 泊松过程
泊松过程:
-
泊松过程是一个增量过程,写作
,其中 ;即, 。 -
定义
为第 n 个事件发生的时刻。 -
得到
的分布函数: 。 -
的概率密度: 。(直接求导,两两相消最后只剩一项) -
相邻事件的时间间隔
,是 的 λ 的指数分布。(泊松过程充要条件)
题型:
- 求
的分布函数、概率密度【背过】。 - 求
的联合概率密度(用 [h,h] 的正方形把 圈起来计算概率),并证明 独立。【背过】
5 鞅
必要的知识:
-
鞅的定义:①
绝对值期望有限,② 鞅性。 -
(
是鞅, 是停时。) -
停时定理 1:满足 ①
停时有限,② 即 X_{停时 和 n 的最小值} 的上界 有限,则 。【貌似常用】-
停时定理 2:满足 ①
停时的期望有限,② 存在 使得 ,则 。 -
停时定理 3:满足 ①
停时有限,② 是鞅的随机过程 绝对值有限,③ 即 n → 无穷的那部分 |Xn| 求和趋于 0,则 。
-
-
上穿不等式:
-
(在需要背过答案的题 鞅收敛定理
出现,背过即可) -
是 上穿 (a,b) 的次数,上穿的意思就是从 a 下面钻到了 b 上面。 -
若
关于 是下鞅(鞅是下鞅),有 -
-
其中
,就是 ReLU()
-
题型:
- 用定义证明鞅。
- 鞅收敛定理
:使用上穿不等式。【背过】 - 对随机游走,证明往左右走的概率 p = 1/2 时,走到 a 或 b 的停时的
。【背过好了】
6 布朗运动的鞅
布朗运动:
- 连续时间,连续状态空间。
,满足正态分布。有增量独立性。- 正态分布的概率密度:
。 - 期望和协方差:
。 都是布朗运动。证明好像是:正态过程 + 轨道连续 + 期望和协方差。
题型:
-
布朗运动的联合概率密度:使用增量独立性。
- 布朗运动相加:直接说满足正态分布,求期望(0)方差(使用协方差)。
- 联合概率密度:先写各个独立增量的联合分布,然后变量代换。我不会搞矩阵那一套。
-
证明布朗运动的鞅(是连续鞅,而非离散鞅):
显然,使用增量独立性。 ,按鞅的定义写开即可。要改成 ,下标是连续时间。 :- 验证绝对值有限:使用正态分布的概率密度,积分 + 写开,发现 = 1。
- 验证鞅性:写开,需要用到
的结论。【背过】(推导方法是积分 + 写开)
-
布朗运动的停时:
- 学习例题,背诵。普通布朗运动、带漂移的布朗运动。【背过】
- 带漂移的布朗运动
的常用鞅: 。【背过】
-
均方收敛:
-
给定
,记 ,证明 -
-
证明:背诵九一居士,直接放缩即可。
- 首先变量代换,
。有 。 - 然后写开,会有一个
和一个 ,把前者(系数为 3 的)提出一个来,跟后面凑平方,剩下两个拿 λ 放掉,放成 。
- 首先变量代换,
7 伊藤公式
貌似讲伊藤公式很清楚的视频:https://www.bilibili.com/video/BV1qZ4y1V7oR/
伊藤公式:
题型 1:证明题,直接构造
题型 2:求
-
首先,
是正态分布,因此计算 μ 和 σ²。 -
,因为 Fubini 定理(?)直接写出积分形式,然后 = 0 即可。 -
: -
-
,是因为独立增量。我们假设 ,这样 ,第一项根据定义是 u,第二项根据独立增量性质, 和 是相互独立的,它们的期望都 = 0,因此第二项 = 0。
本文作者:MoonOut
本文链接:https://www.cnblogs.com/moonout/p/18701951
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
2024-02-07 offline 2 online | Cal-QL:校准保守 offline 训出的 Q value,让它与真实 reward 尺度相当
2024-02-07 offline 2 online | 重要性采样,把 offline + online 数据化为 on-policy samples