摘要:
准备 awk的取名是贝尔实验室的Alfred.Aho和Peter.Weinberger和Brain.Kernigham三个人的名字取首字母组成的。awk命令能从一个或多个文本文件或字符串中逐个记录或逐行扫描;将每个记录与匹配模式相比较;当发现匹配格式时抽取数据或格式化报文,或执行相应的文本操作。 a 阅读全文
摘要:
Intro 众所周知,在2014年,Deepmind使用DQN刷新了强化学习在Atari游戏上的SOTA记录。使DQN成为当年的SOTA,主要依靠两大利器:ReplayBuffer和TargetNetwork。 ReplayBuffer 采样与更新是这样的: 更新是在采样中的,更新和采样靠repla 阅读全文