摘要: 前言 总是会有一些领域里的常识,以这个标签来记录我学到的“常识”。 能量单位:焦耳 一焦耳等于 1N 的力在对应力的方向上移动1米所做的功,也等于 1W 的功率在1秒内所做的功。 1千瓦时就是1度。 参考链接:https://baijiahao.baidu.com/s?id=173885587665 阅读全文
posted @ 2023-03-16 21:49 芋圆院长 阅读(815) 评论(0) 推荐(0) 编辑
摘要: 常用方法包括: 观察值函数的变化:在训练过程中,可以观察值函数的变化情况,如果值函数的变化趋势逐渐变缓,最终基本不再变化,可以认为值函数已经收敛。 判断动作状态值函数的变化:在 Q-learning 等算法中,动作价值函数可以表示为每个状态下每个动作的价值。可以通过计算每个状态下所有动作价值函数的差 阅读全文
posted @ 2023-03-16 15:13 芋圆院长 阅读(459) 评论(0) 推荐(0) 编辑