dopamine源码解析之dqn_agent
摘要:目录 epsilon函数 DQNAgent构造函数核心参数 DQNAgent核心函数 tf.make_template 核心数据流图 epsilon函数 linearly_decaying_epsilon,线性的对epsilon进行递减,先保持1.0一段时间(warmup_steps),然后线性递减
阅读全文
posted @ 2018-10-06 11:16
posted @ 2018-10-06 11:16
|
|||||||||
日 | 一 | 二 | 三 | 四 | 五 | 六 | |||
---|---|---|---|---|---|---|---|---|---|
23 | 24 | 25 | 26 | 27 | 28 | 1 | |||
2 | 3 | 4 | 5 | 6 | 7 | 8 | |||
9 | 10 | 11 | 12 | 13 | 14 | 15 | |||
16 | 17 | 18 | 19 | 20 | 21 | 22 | |||
23 | 24 | 25 | 26 | 27 | 28 | 29 | |||
30 | 31 | 1 | 2 | 3 | 4 | 5 |
Dimension, DimensionHandle, DimensionOrConstant 这三个为什么不合成一个, 感觉有点自找麻烦呢?
想问下, 为什么需要DimensionHandle和ShapeHandle这样的类? 为什么不直接用Dimension和Shape??
int output_slot:31;
bool is_last:1;
这种定义形式是c语言支持的,和c++11没有关系