10 2020 档案

摘要:[手写数字识别]资源配置 概述 从前几节的训练看,无论是房价预测任务还是MNIST手写字数字识别任务,训练好一个模型不会超过十分钟,主要原因是我们所使用的神经网络比较简单。但实际应用时,常会遇到更加复杂的机器学习或深度学习任务,需要运算速度更高的硬件(如GPU、NPU),甚至同时使用多个机器共同训练 阅读全文
posted @ 2020-10-23 15:26 biiigwang 阅读(332) 评论(0) 推荐(0) 编辑
摘要:手写数字识别之优化算法 概述 上一节我们明确了分类任务的损失函数(优化目标)的相关概念和实现方法,本节我们依旧横向展开"横纵式"教学法,如 图1 所示,本节主要探讨在手写数字识别任务中,使得损失达到最小的参数取值的实现方法。 图1:“横纵式”教学法 — 优化算法 前提条件 在优化算法之前,需要进行数 阅读全文
posted @ 2020-10-20 21:29 biiigwang 阅读(646) 评论(0) 推荐(0) 编辑
摘要:[手写数字识别]之损失函数 概述 上一节我们尝试通过更复杂的模型(经典的全连接神经网络和卷积神经网络),提升手写数字识别模型训练的准确性。本节我们继续将“横纵式”教学法从横向展开,如 图1 所示,探讨损失函数的优化对模型训练效果的影响。 图1:“横纵式”教学法 — 损失函数优化 **损失函数是模型优 阅读全文
posted @ 2020-10-19 09:38 biiigwang 阅读(926) 评论(0) 推荐(0) 编辑
摘要:网络结构 概述 前几节我们尝试使用与房价预测相同的简单神经网络解决手写数字识别问题,但是效果并不理想。原因是手写数字识别的输入是28 × 28的像素值,输出是0-9的数字标签,而线性回归模型无法捕捉二维图像数据中蕴含的复杂信息,如 图1 所示。无论是牛顿第二定律任务,还是房价预测任务,输入特征和输出 阅读全文
posted @ 2020-10-18 17:13 biiigwang 阅读(645) 评论(0) 推荐(0) 编辑
摘要:算法复杂度分析若干实例 记录leetcode每日一题算法复杂度分析过程: 2020.10.14 查找常用字符 题目链接 == >https://leetcode-cn.com/problems/find-common-characters/ class Solution: def commonCha 阅读全文
posted @ 2020-10-15 11:36 biiigwang 阅读(106) 评论(0) 推荐(0) 编辑
摘要:深度学习模型的通用步骤 数据处理--> 模型设计--> 训练配置--> 训练过程--> 模型保存 正是由于深度学习的建模和训练的过程存在通用性,在构建不同的模型时,只有模型三要素不同,其它步骤基本一致,深度学习框架才有用武之地。 |数据处理 数据处理包含五个部分:数据导入、数据形状变换、数据集划分、 阅读全文
posted @ 2020-10-13 22:00 biiigwang 阅读(652) 评论(0) 推荐(0) 编辑
摘要:|数据处理 上一节,我们通过调用飞桨提供的API(paddle.dataset.mnist)加载MNIST数据集。但在工业实践中,我们面临的任务和数据环境千差万别,通常需要自己编写适合当前任务的数据处理程序,一般涉及如下五个环节: 读入数据 划分数据集 生成批次数据 训练样本集乱序 校验数据有效性 阅读全文
posted @ 2020-10-13 21:58 biiigwang 阅读(258) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示