摘要: 从这里开始换个游戏演示,cartpole游戏 Deep Q Network 实例代码 阅读全文
posted @ 2019-01-10 15:14 阿夏z 阅读(639) 评论(0) 推荐(0) 编辑
摘要: Q-learning 实例代码 阅读全文
posted @ 2019-01-10 15:11 阿夏z 阅读(442) 评论(0) 推荐(0) 编辑
摘要: Sarsa算法 实例代码 阅读全文
posted @ 2019-01-10 15:10 阿夏z 阅读(549) 评论(0) 推荐(0) 编辑
摘要: 蒙特卡洛方法 实例代码 下面代码是constant-α monte carlo,这里有一点介绍 阅读全文
posted @ 2019-01-10 15:08 阿夏z 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 策略迭代 实例代码 阅读全文
posted @ 2019-01-10 15:06 阿夏z 阅读(306) 评论(0) 推荐(0) 编辑
摘要: 值迭代 实例代码 阅读全文
posted @ 2019-01-10 15:06 阿夏z 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 1 CXX = g++ 2 LIBS +=`pkg-config --libs opencv` 3 INC +=`pkg-config --cflags opencv` 4 CPPFLAGS += -g -std=c++11 -Wall 5 6 SRCS = detect.cpp 7 TARGET = detect 8 OBJS = detect.o 9 10 $(TARG... 阅读全文
posted @ 2018-12-14 15:35 阿夏z 阅读(1629) 评论(0) 推荐(0) 编辑
摘要: 非监督算法综述:未完成 阅读全文
posted @ 2018-11-26 19:41 阿夏z 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 见下面 wiki:https://en.wikipedia.org/wiki/Numerical_stability 阅读全文
posted @ 2018-11-21 14:00 阿夏z 阅读(460) 评论(0) 推荐(0) 编辑
摘要: TensorArray可以看做是具有动态size功能的Tensor数组。通常都是跟while_loop或map_fn结合使用 tips:[n.name for n in tf.get_default_graph().as_graph_def().node]获取图中所有节点 阅读全文
posted @ 2018-11-06 11:05 阿夏z 阅读(670) 评论(0) 推荐(0) 编辑