摘要: 以离散时间系统为例,对自适应动态规划(Adaptive Dynamic Programming,ADP)中Action Network和Critic Network两个网络的更新方式进行说明。 一、系统定义 1.状态方程 state equation ${X_{k + 1}} = {F_k}({X_ 阅读全文
posted @ 2021-08-10 16:54 吃瓜的哲学 阅读(1309) 评论(0) 推荐(1) 编辑