摘要:
model.train() and model.eval() 定义了模型的训练和测试两种模式, 对部分层有影响, 如Dropout和BatchNormal Dropout: 为了增加模型的泛化能力(防止过拟合),训练过程中可以随机屏蔽掉一些神经元,测试时恢复。 BatchNormal: 训练过程中有 阅读全文
摘要:
前言 实例参考MorvanZhou/Reinforcement-learning-with-tensorflow, 更改为PyTorch实现,并增加了几处优化。实现效果如下。 其中,红色方块作为探索的智能体,到达黄色圆形块reward=1,到达黑色方块区域reward=-1. 代码 程序主循环 fr 阅读全文
摘要:
前言 1 Q-Learning算法实现 首先,需要知道Q表和其更新公式 Q表,定义了状态(state)和行为(action) Q表更新,Q(s1,a2)=Q(s1,a2)+lrdiff,diff(差距)=现实-估计=R+rmaxQ(s2)-Q(s1,a2) 然后,算法工作流程是: 按照Q表或随机选择 阅读全文
摘要:
强化学习简介 强化学习类似试错法,让计算机从错误中学习最后找到规律。例子,Alpha Go 监督学习对具有标签的数据进行学习,强化学习对没有标签的数据进行学习, 但在环境的一次次尝试中获取这些标签学习到规律。 强化学习分类:1)通过价值选则行为:Q Learning,Sarsa,Deep Q Net 阅读全文
摘要:
self不是Python关键字,可以换变量名,第一个变量传入类的实例 内置类属性: dict:类属性,doc:类文档字符串 name:类名,__module:类定义所在的模块,bases:所有父类组成的元组 __repr:转化为提供解释器读取形式,str:输出形式,cmp:对象比较 对象的垃圾回收机 阅读全文
摘要:
视频 强化学习入门-视频 BiliBili-同步 代码 教程 书籍 书籍-强化学习 代码 论文 强化学习关键论文 开源库 参考 强化学习资料 阅读全文
摘要:
1-引言和线性回归模型 2-数字知识、多元梯度下降和正规方程 3-分类和过拟合 4-神经网络和反向传播 5-评估模型和误差分析 6-核函数和聚类算法 7-PCA和异常检测 8-推荐算法、大数据集和OCR 阅读全文
摘要:
Dynamic Routing Between Capsules RBVS-NET: A ROBUST CONVOLUTIONAL NEURAL NETWORK FOR RETINAL BLOOD VESSEL SEGMENTATION Net: TernausNet, VGG11->ResNet1 阅读全文
摘要:
16 推荐算法 前言 推荐算法是机器学习领域一个重要的应用 预测电影评分 基于内容的推荐算法 手工特征 公式化 优化方法 基于协同过滤的推荐算法 自动学习特征 协同过滤算法 向量化实现 均值规范化 17 大数据集上的机器学习 大数据集 随机梯度下降 随机梯度下降:选择一个样本训练,批量梯度下降:选择 阅读全文
摘要:
14 PCA 第二种无监督学习,降维 可视化数据 50维数据降低到2维进行可视乎 降维方法: PCA(主成成分分析),降维会忽视一些空间信息,但是会最大限度保留最主要的空间信息 找到超平面,使得投影距离最小 向量化,PCA解决多维问题方法 与线性回归的区别 主成成分分析:算法实现 数据归一化 应用P 阅读全文