随笔档案「2021年1月」 - Uzuki

Opencv | 图形学 | Mingw64 | 如何正确地用MinGW64编译与配置vscode的Opencv环境

摘要：最近有关于图形学的授课，教授开始布置的上机打码的代码实现作业了。虽说教授为了让我们省心，直接就整了个环境已经配置好的几个G的虚拟机给我们用。但是你也懂的，虚拟机打码，卡得要命。一开始还以为会用到什么高级的库，看了下就是个Eigen3和Opencv，对于Opencv，感觉自己手动在本地配一个就OK了。在配置的过程中才发现这玩意坑是尼玛的多，而且还是不带附加件的情况下，因此本篇博客应然而生。阅读全文

posted @ 2021-01-31 14:06 Uzuki 阅读(1427) 评论(0) 推荐(1)

机器学习 | 强化学习（8） | 探索与开发（Exploration and Exploitation）

摘要：8-探索与开发（Exploration and Exploitation） 1.导论探索与开发二难问题基于决策的决策过程存在以下两种选择开发：基于目前的学习做最优的决策探索：获取更多的学习最佳的长期策略或许会包含一些短期的牺牲获取足够的信息更能得到最为全面的决策探索的方案（Approa 阅读全文

posted @ 2021-01-17 20:24 Uzuki 阅读(2872) 评论(0) 推荐(1)

机器学习 | 强化学习（7） | 融合学习与规划（Integrating Learning and Planning）

摘要：7-融合学习与规划（Integrating Learning and Planning） 1.导论基于模型的强化学习（Model-Based Reinforcement Learning）在上一个课程中，是从记录序列中直接学习策略的在过往的课程中，是从记录序列中直接学习价值函数的而本次课程，阅读全文

posted @ 2021-01-17 20:13 Uzuki 阅读(826) 评论(0) 推荐(0)

机器学习 | 强化学习（6） | 策略梯度方法（Policy Gradient Method）

摘要：6-策略梯度方法（Policy Gradient Method）策略梯度概论（Introduction）基于策略（Policy-Based）的强化学习对于上一节课（价值函数拟合）中采用参数$\theta$来估计价值和动作-价值函数 \[ \begin{align} V_\theta(S) & 阅读全文

posted @ 2021-01-17 20:10 Uzuki 阅读(1877) 评论(0) 推荐(0)

机器学习 | 强化学习（5） | 价值函数拟合（Value Function Approximation）

摘要：价值函数拟合（Value Function Approximation）导论（Introduction）目前的价值函数都是基于打表法（lookup table）进行穷举对于所有状态$s$都有一个实体$V(s)$去表示或者对于每个状态-价值函数对$s,a$都有一个实体$Q(s,a)$去表示对阅读全文

posted @ 2021-01-17 19:55 Uzuki 阅读(940) 评论(0) 推荐(0)

机器学习 | 强化学习（4） | 无模型控制（Model-Free Control）

摘要：无模型控制（Model-Free Control）无模型预测概论上一节课：无模型预测用于估计一个未知马尔科夫决策过程的价值函数这节课无模型控制最优化一个未知马尔科夫决策过程的价值函数一般在以下两种情况采用无模型预测马尔科夫决策过程是未知的，仅能通过采用得到记录马尔科夫决策过程是已阅读全文

posted @ 2021-01-17 19:47 Uzuki 阅读(639) 评论(0) 推荐(0)

机器学习 | 强化学习（3） | 无模型预测（Model-Free Prediction）

摘要：上一节课《通过DP求解》可以解决一个已知的马尔科夫决策过程本节课实践无模型预测解决或者估计一个未知马尔科夫决策过程的价值函数下一节课实现无模型决策（Model-free control）最优化一个马尔科夫决策过程的价值函数阅读全文

posted @ 2021-01-17 19:36 Uzuki 阅读(1013) 评论(0) 推荐(0)

机器学习 | 强化学习（2） | 动态规划求解（Planning by Dynamic Programming）

摘要：动态（Dynamic)：序列性又或是时序性的问题部分规划（Programming）：最优化一个程序（Program），i.e 一种策略线性规划（Linear Programming）显然马尔科夫决策过程就符合动态规划的顺序阅读全文

posted @ 2021-01-17 18:09 Uzuki 阅读(651) 评论(0) 推荐(0)

Loading

Uzuki

01 2021 档案

公告