强化学习精要第一二章
1、np.dot的用法,用于向量的时候是点积,用于矩阵的时候是矩阵的乘法,一个向量只有一行的时候,它的shape是(列数, )
2、matplot画图,更改图中的字体,
mpl.rcParams['font.sans-serif'] = ['WenQuanYi Micro Hei'] #指定默认字体WenQuanYi Micro Hei中文,DejaVu Sans英文
https://www.jianshu.com/p/240ea3ae0dc9(查看字体、负号的问题)
如果有多条直线,一般用不同的linespace表示,‘--’、‘:’
3、np.log2:以对数为底
np.meshgrid(x,y):坐标矩阵
4、KL散度的性质:非负,两个分布越接近,散度越小,分布越远,散度越大
5、损失函数有两种:平方损失函数和交叉熵损失函数,回归问题损失函数是平方损失函数,分类问题损失函数是交叉熵损失函数