你好啊渔夫

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2019年8月14日

摘要: Q-learning是off-policy,而Sarsa是on-policy学习。 Q-learning在更新Q table时,它只会需要Q值最大,但是不一定会选择使这个Q值最大的动作,因为选择哪个动作是由其他的策略决定的,但是Sarsa在更新Q table时,不一定是Q最大的那个,而且接下来会选择 阅读全文
posted @ 2019-08-14 16:56 你好啊渔夫 阅读(2337) 评论(0) 推荐(0) 编辑

摘要: Q-learning的算法: (1)先初始化一个Q table,Q table的行数是state的个数,列数是action的个数。 (2)先随机选择一个作为初始状态S1,根据一些策略选择此状态下的动作,比如贪心策略,假设选择的动作为A1。 (3)判断由A1动作之后的状态S2是不是终止状态,如果是终止 阅读全文
posted @ 2019-08-14 16:23 你好啊渔夫 阅读(762) 评论(0) 推荐(0) 编辑

2019年6月6日

摘要: 查看显卡使用情况: nvidia-smi 设置tensorflow按需分配资源: import os os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" os.environ["CUDA_VISIBLE_DEVICES"] = "1" # 使用第二块GPU( 阅读全文
posted @ 2019-06-06 13:21 你好啊渔夫 阅读(1024) 评论(0) 推荐(0) 编辑

2019年5月31日

摘要: 此使,找到DVD1光驱,右键弹出,然后回到dvd2.iso文件右键装载,回到matlab安装页面,对提示框“弹出DVD1插入DVD2”点击确定,安装即可继续进行。 阅读全文
posted @ 2019-05-31 11:15 你好啊渔夫 阅读(6737) 评论(0) 推荐(0) 编辑

2019年5月15日

摘要: 今天用conda install 任何包都会出现这个错误: 阅读全文
posted @ 2019-05-15 21:43 你好啊渔夫 阅读(14577) 评论(0) 推荐(4) 编辑

摘要: 在网上找到的方法,如下: import h5py import numpy as np #HDF5的写入: imgData = np.zeros((2,4)) f = h5py.File('HDF5_FILE.h5','w') #创建一个h5文件,文件指针是f f['data'] = imgData 阅读全文
posted @ 2019-05-15 13:31 你好啊渔夫 阅读(2841) 评论(0) 推荐(0) 编辑

2019年5月6日

摘要: 这个在线工具的网址为:http://www.tablesgenerator.com/latex_tables,好用。 阅读全文
posted @ 2019-05-06 21:21 你好啊渔夫 阅读(6807) 评论(0) 推荐(0) 编辑

摘要: 经常用latex写论文,免不了要敲各种公式,今天和大家分享一个神器-snip,它可以直接将公式转化为代码,不需要我们自己编写公式代码,方便快捷,准确率极高。该神器的下载地址为:https://mathpix.com/。下载完成之后直接安装就好,安装完成之后,使用快捷键Alt+Ctrl+M,就可以像截 阅读全文
posted @ 2019-05-06 16:26 你好啊渔夫 阅读(10144) 评论(0) 推荐(0) 编辑

2019年4月29日

摘要: 因为要用到lifelines 包,在cmd中使用conda install lifelines ,显示如下错误: PackagesNotFoundError: The following packages are not available from current channels: - life 阅读全文
posted @ 2019-04-29 14:44 你好啊渔夫 阅读(95089) 评论(0) 推荐(7) 编辑

2019年4月24日

摘要: 结果: 阅读全文
posted @ 2019-04-24 10:49 你好啊渔夫 阅读(953) 评论(0) 推荐(0) 编辑