随笔分类 -  🍇 THUDA · PhD 笔记

应用随机过程 | 泊松过程、指数分布、事件到达率
摘要:询问 deepseek 泊松过程、指数分布和事件到达率的含义。
4
0
0
应用随机过程 | 期末知识点总结
摘要:出分后发布笔记……
34
0
0
RL 基础 | Policy Gradient 的推导
摘要:如果想最大化期望下的 R(τ),那么策略梯度 = R(τ) · Σ ▽log π(a|s) ,即 discounted return × Σ 梯度 log [选取该 action 的概率] 。
231
0
0
PID 控制 |(搬运)教程与 python 代码
摘要:Proportional-Integral-Derivative(PID),比例-积分-微分控制。
391
0
0
凸优化 | 期末复习笔记存档
摘要:出分后发布笔记……
443
0
0
概率图 | 两次小测的笔记存档
摘要:出分后发布笔记……
56
0
0
复杂系统 | 20240116 · 考试题目回忆版
摘要:出分后发布笔记……
48
0
0
复杂系统 | 考前知识点总结(不完全)
摘要:出分后发布笔记……
58
0
1
“嵌套分区法,是一种良策;将海洋分成块,每块都探测。”
摘要:为了帮助你更好地理解 Nested Partition 算法,我为你生成了一首诗,用比喻的方式描述了这种算法的过程。希望这对你有所帮助。😊
112
1
0
RL 基础 | 讲的很好的 TRPO 博客
摘要:一篇知乎 TRPO 博客,感觉 idea 讲的很清楚,特来搬运。
35
0
0
概率图 · 概率论基础 | 讲的非常好的 KL 散度博客
摘要:感觉讲的非常好,谢谢善良的博主 😊🙏🏻
21
0
0
线性代数 · 矩阵 · Matlab | Moore-Penrose 伪逆矩阵代码实现
摘要:写伪逆矩阵计算代码,是专业课作业 2333,挑了两个好实现的算法写一下。
501
0
0
凸优化 | Lagrange 对偶:极大极小不等式的证明
摘要:sup inf ≤ inf sup,证明关键: inf_w f(w,z) 是 f(w0,z) 逐点下界,对于任意 w0。
227
1
0
线性代数 · 矩阵 · Matlab | 满秩分解代码实现
摘要:满秩分解的计算方法,居然意外的简单。
386
0
0
RL 基础 | Policy Iteration 的收敛性证明
摘要:1. Policy Evaluation 会收敛,因为贝尔曼算子是压缩映射;2. Policy Improvement 有策略性能改进的保证。
306
3
0
线性代数 · 矩阵 · Matlab | Cholesky 分解代码实现
摘要:Cholesky 分解是 LU 分解(三角分解)的特殊形式,n 阶实对称正定矩阵 A = LL^T,其中 L 为下三角;搬运外网的代码,非原创。
377
0
0
RL 基础 | Value Iteration 的收敛性证明
摘要:贝尔曼算子 BV = max[r(s,a) + γV(s')] 是压缩映射,因此 {V, BV, B²V, ...} 是柯西序列,会收敛到 V=BV 的不动点。
708
0
0
点击右上角即可分享
微信分享提示
深色
回顶
收起
  1. 1 Sibelius: Violin Concerto in D Minor, Op. 47:III. Allegro, ma non tanto Jascha Heifetz / Chicago Symphony Orchestra
Sibelius: Violin Concerto in D Minor, Op. 47:III. Allegro, ma non tanto - Jascha Heifetz / Chicago Symphony Orchestra
00:00 / 00:00
An audio error has occurred.