随笔分类 - 强化学习
代码学习、神经网络学习、神经网络的训练学习和理论知识学习
摘要:经验回放:这是训练过程中经常用到的一个概念。 是强化学习中一个重要的技巧,可以大幅度提升强化学习的表现。具体操作:把智能体 与环境交互的记录(经验)储存在一个数组里,事后反复 利用这些经验训练智能体,这个数组也叫做经验回放数组(replay buffer)。 在算法中的应用 博客学习:https:/
阅读全文
摘要:注意:此处我建立的是python=3.5.4,环境名为xn退出建立的环境:deactivate删除环境:conda remove -n xn --all(之前的python版本不对,所以 卸载)创建x版本的xx虚拟环境conda create -n xn python=3.5.4激活环境(进入环境)
阅读全文
摘要:在学习莫烦可视化的过程中,有一个不懂得函数 ,大概了解了一下: fig = plt.figure() ax = fig.add_subplot(111) import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 4, 9, 16, 20]
阅读全文
摘要:import tensorflow as tf import numpy as np def add_layer(inputs,in_size,out_size,activation_function=None): #inputs是输入的值,in_size输入值的大小,out_size输出值的大小
阅读全文
摘要:tf.zeros()函数 创建一个所有元素都设置为零的张量. tf.zeros([3, 4], tf.int32) # [[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]] 函数参数: shape:整数、整数元组或类型为int32的1维Tensor的列表. dtype
阅读全文
摘要:学习博客:https://www.jianshu.com/p/31880cc88ae7 tensorflow是一个“符号式编程框架”,所有的计算步骤(包括数据定义等等)都要在一个graph中事先定义好,然后通过session来执行这个graph(全部或部分),得到结果。 所以可见在tf中sessio
阅读全文
摘要:import tensorflow as tf state = tf.Variable(0,name = 'counter')#一定要定义成它是变量,它才是个变量 #0就是这个变量的值,而name就是变量的名字 print(state.name) #变量加上常量还是变量 one = tf.const
阅读全文
摘要:1.什么是计算图: 一个机器学习任务的核心是模型的定义以及模型的参数求解方式,对这两者进行抽象之后,可以确定一个唯一的计算逻辑,将这个逻辑用图表示,称之为计算图。计算图表现为有向无环图,定义了数据的流转方式,数据的计算方式,以及各种计算之间的相互依赖关系等。 2.计算图的基本组成 TensorFlo
阅读全文
摘要:import tensorflow as tf #创建两个矩阵maxtrix,然后输出两个矩阵相乘的结果 matrix1 = tf.constant([[3,3]])#constant表示maxtrix1是一个常数,[3,3]表示是一个一行两列的结果 matrix2 = tf.constant([[
阅读全文
摘要:import tensorflow as tf import numpy as np #导入有关数学的包 #随机生成一些数据 create data x_data = np.random.rand(100).astype(np.float32) y_data = x_data*0.1 + 0.3 #
阅读全文