2017 年 11月 25 日随笔档案 - 历久弥坚0820

2017年11月25日

摘要：根据Q表估计 a1(选择1的赋值) a2（选择2的赋值） s1(行动1) -2 1 s2(行动2) -4 2 Q Learning算法（Q Learning Alogrithm）: #以下为伪代码递推关系：阅读全文

posted @ 2017-11-25 19:56 历久弥坚0820 阅读(312) 评论(0) 推荐(0) 编辑

摘要：环境： Windows 10操作系统 python idle 原理：调用windows系统自带的命令task，该命令使用方式：第一步、调用cmd命令行，显示当前系统中所有进程； Win+R->cmd->(input)tasklist 第二步、调用taskkill命令，关闭指定的进程； taskk 阅读全文

posted @ 2017-11-25 19:31 历久弥坚0820 阅读(14705) 评论(0) 推荐(1) 编辑