摘要: 该篇论文描述了采用函数逼近法进行深度强化学习所遇到的问题,即会产生过高估计。 所谓函数逼近,指的是采用复杂函数估计state-value function值。一般Q-learning有以下表示: \[\mathcal { Q } ( s , a ) \quad - \quad r _ { s } ^ 阅读全文
posted @ 2019-03-09 21:47 Ruidongch 阅读(500) 评论(0) 推荐(0) 编辑
摘要: 前几天面试算法岗遇到这样一道题目:给定一个实时的数据流,分别是员工ID,员工入职时间或者时员工离职时间,要求设计函数返回当时在公司工作时间最长的员工ID。 因为我做题太少的原因,当时针对这一题很多没搞清楚,在回学校仔细思考后,给出下面的解答,并以此为戒,多做题!!!! 首先最简单的思路是用单向链表存 阅读全文
posted @ 2019-02-28 21:20 Ruidongch 阅读(485) 评论(0) 推荐(0) 编辑
摘要: 主要按照https://www.jianshu.com/p/a86ccd96b78a教程在mac上配置hadoop3.1.1伪分布式 配置完伪分布式文件后,在hadoop目录下第一次运行 ./bin/hdfs namenode -format ./sbin/start-dfs.sh 发现不能打开98 阅读全文
posted @ 2018-11-27 14:12 Ruidongch 阅读(225) 评论(0) 推荐(0) 编辑
摘要: 业界一直在谈论大数据,对于统计而言,大数据其实意味着要不是样本量增加n→∞,要不就是维度的增加p→∞,亦或者两者同时增加,并且维度与样本量的增长速度呈线性或者指数型增长。在稀疏性的假设条件下,再加上一些正则性方法,统计学家可以证明各种加penalty的模型所给出的参数估计具有良好的统计性质,收敛速度 阅读全文
posted @ 2017-07-28 09:58 Ruidongch 阅读(1556) 评论(0) 推荐(0) 编辑
摘要: 建立ARMAX模型需要运用R的dse包,在R的dse包中The ARMA model representation is general, so that VAR, VARX,ARIMA, ARMAX, ARIMAX can all be considered to be special cases 阅读全文
posted @ 2017-05-26 23:43 Ruidongch 阅读(11686) 评论(0) 推荐(1) 编辑
摘要: 对于明显的周期性时间序列,可以使用decompose函数对数据进行分解成季节部分、趋势部分、随机部分三种。decompose函数有两种type,即“additive”以及“multiplicative”两种,还有一个fliter选项,表示是否加入线性滤波,一般fliter选择NULL即可。下面的例子 阅读全文
posted @ 2017-05-25 10:14 Ruidongch 阅读(20996) 评论(0) 推荐(1) 编辑