摘要: 根据Q表估计 a1(选择1的赋值) a2(选择2的赋值) s1(行动1) -2 1 s2(行动2) -4 2 Q Learning算法(Q Learning Alogrithm): #以下为伪代码 递推关系: 阅读全文
posted @ 2017-11-25 19:56 历久弥坚0820 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 环境: Windows 10操作系统 python idle 原理: 调用windows系统自带的命令task,该命令使用方式: 第一步、调用cmd命令行,显示当前系统中所有进程; Win+R->cmd->(input)tasklist 第二步、调用taskkill命令,关闭指定的进程; taskk 阅读全文
posted @ 2017-11-25 19:31 历久弥坚0820 阅读(14692) 评论(0) 推荐(1) 编辑