随笔分类 - 强化学习

代码学习、神经网络学习、神经网络的训练学习和理论知识学习

摘要：经验回放：这是训练过程中经常用到的一个概念。是强化学习中一个重要的技巧，可以大幅度提升强化学习的表现。具体操作：把智能体与环境交互的记录（经验）储存在一个数组里，事后反复利用这些经验训练智能体，这个数组也叫做经验回放数组（replay buffer)。在算法中的应用博客学习：https:/ 阅读全文

posted @ 2022-10-28 17:51 bokeyuan-aa 阅读(113) 评论(0) 推荐(0) 编辑

在anaconda中下载python设置虚拟环境|下载强化学习需要的包

摘要：注意：此处我建立的是python=3.5.4，环境名为xn退出建立的环境：deactivate删除环境：conda remove -n xn --all（之前的python版本不对，所以卸载）创建x版本的xx虚拟环境conda create -n xn python=3.5.4激活环境（进入环境）阅读全文

posted @ 2022-10-26 11:23 bokeyuan-aa 阅读(116) 评论(0) 推荐(0) 编辑

可视化

摘要：在学习莫烦可视化的过程中，有一个不懂得函数，大概了解了一下： fig = plt.figure() ax = fig.add_subplot(111) import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [1, 4, 9, 16, 20] 阅读全文

posted @ 2022-10-25 23:13 bokeyuan-aa 阅读(196) 评论(0) 推荐(0) 编辑

构建一个神经网络

摘要：import tensorflow as tf import numpy as np def add_layer(inputs,in_size,out_size,activation_function=None): #inputs是输入的值，in_size输入值的大小，out_size输出值的大小阅读全文

posted @ 2022-10-25 20:34 bokeyuan-aa 阅读(22) 评论(0) 推荐(0) 编辑

tf怎么创建层函数

摘要：tf.zeros()函数创建一个所有元素都设置为零的张量. tf.zeros([3, 4], tf.int32) # [[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]] 函数参数： shape：整数、整数元组或类型为int32的1维Tensor的列表. dtype 阅读全文

posted @ 2022-10-25 17:41 bokeyuan-aa 阅读(41) 评论(0) 推荐(0) 编辑

tf中的op、placeholder

摘要：学习博客：https://www.jianshu.com/p/31880cc88ae7 tensorflow是一个“符号式编程框架”，所有的计算步骤（包括数据定义等等）都要在一个graph中事先定义好，然后通过session来执行这个graph（全部或部分），得到结果。所以可见在tf中sessio 阅读全文

posted @ 2022-10-25 16:05 bokeyuan-aa 阅读(532) 评论(0) 推荐(0) 编辑

tf中的Variable

摘要：import tensorflow as tf state = tf.Variable(0,name = 'counter')#一定要定义成它是变量，它才是个变量 #0就是这个变量的值，而name就是变量的名字 print(state.name) #变量加上常量还是变量 one = tf.const 阅读全文

posted @ 2022-10-25 15:13 bokeyuan-aa 阅读(42) 评论(0) 推荐(0) 编辑

什么是计算图

摘要：1.什么是计算图：一个机器学习任务的核心是模型的定义以及模型的参数求解方式，对这两者进行抽象之后，可以确定一个唯一的计算逻辑，将这个逻辑用图表示，称之为计算图。计算图表现为有向无环图，定义了数据的流转方式，数据的计算方式，以及各种计算之间的相互依赖关系等。 2.计算图的基本组成 TensorFlo 阅读全文

posted @ 2022-10-25 00:26 bokeyuan-aa 阅读(972) 评论(0) 推荐(0) 编辑

tensorflow中session的用法，莫烦的例子（2）

摘要：import tensorflow as tf #创建两个矩阵maxtrix，然后输出两个矩阵相乘的结果 matrix1 = tf.constant([[3,3]])#constant表示maxtrix1是一个常数,[3,3]表示是一个一行两列的结果 matrix2 = tf.constant([[ 阅读全文

posted @ 2022-10-24 23:20 bokeyuan-aa 阅读(44) 评论(0) 推荐(0) 编辑

莫烦python的tf神经网络训练例子（1）

摘要：import tensorflow as tf import numpy as np #导入有关数学的包 #随机生成一些数据 create data x_data = np.random.rand(100).astype(np.float32) y_data = x_data*0.1 + 0.3 # 阅读全文

posted @ 2022-10-24 16:33 bokeyuan-aa 阅读(84) 评论(0) 推荐(0) 编辑

公告

昵称： bokeyuan-aa
园龄： 5年5个月
粉丝： 2
关注： 6

+加关注

2025年3月

日

一

二

三

四

五

六

bokeyuan-aa

随笔分类 - 强化学习

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜