摘要:
Q-learning是off-policy,而Sarsa是on-policy学习。 Q-learning在更新Q table时,它只会需要Q值最大,但是不一定会选择使这个Q值最大的动作,因为选择哪个动作是由其他的策略决定的,但是Sarsa在更新Q table时,不一定是Q最大的那个,而且接下来会选择 阅读全文
摘要:
Q-learning是off-policy,而Sarsa是on-policy学习。 Q-learning在更新Q table时,它只会需要Q值最大,但是不一定会选择使这个Q值最大的动作,因为选择哪个动作是由其他的策略决定的,但是Sarsa在更新Q table时,不一定是Q最大的那个,而且接下来会选择 阅读全文
摘要:
Q-learning的算法: (1)先初始化一个Q table,Q table的行数是state的个数,列数是action的个数。 (2)先随机选择一个作为初始状态S1,根据一些策略选择此状态下的动作,比如贪心策略,假设选择的动作为A1。 (3)判断由A1动作之后的状态S2是不是终止状态,如果是终止 阅读全文
摘要:
查看显卡使用情况: nvidia-smi 设置tensorflow按需分配资源: import os os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" os.environ["CUDA_VISIBLE_DEVICES"] = "1" # 使用第二块GPU( 阅读全文
摘要:
此使,找到DVD1光驱,右键弹出,然后回到dvd2.iso文件右键装载,回到matlab安装页面,对提示框“弹出DVD1插入DVD2”点击确定,安装即可继续进行。 阅读全文
摘要:
今天用conda install 任何包都会出现这个错误: 阅读全文
摘要:
在网上找到的方法,如下: import h5py import numpy as np #HDF5的写入: imgData = np.zeros((2,4)) f = h5py.File('HDF5_FILE.h5','w') #创建一个h5文件,文件指针是f f['data'] = imgData 阅读全文
摘要:
这个在线工具的网址为:http://www.tablesgenerator.com/latex_tables,好用。 阅读全文
摘要:
经常用latex写论文,免不了要敲各种公式,今天和大家分享一个神器-snip,它可以直接将公式转化为代码,不需要我们自己编写公式代码,方便快捷,准确率极高。该神器的下载地址为:https://mathpix.com/。下载完成之后直接安装就好,安装完成之后,使用快捷键Alt+Ctrl+M,就可以像截 阅读全文
摘要:
因为要用到lifelines 包,在cmd中使用conda install lifelines ,显示如下错误: PackagesNotFoundError: The following packages are not available from current channels: - life 阅读全文
|