上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页
摘要: 在进行模型搭建时常用的解决过拟合的方法有以下几种: · 采用更多的数据 · 迫使模型的复杂度降低(减少层数、正则化) · dropout(提高鲁棒性) · 提早结束训练过程 · 数据增强 这里重点讲正则化(regularization) 假定对于一个二分类问题,它的交叉熵损失函数为 J(ω) = - 阅读全文
posted @ 2020-02-01 15:52 赵代码 阅读(940) 评论(1) 推荐(1) 编辑
摘要: 在真实的应用中,我们往往想要的不仅仅是模型能够在训练集上表现良好,而是希望训练得到的模型也能在未知的新输入数据上(这些新输入数据就是测试集)表现良好。这种能在未知的新输入数据上表现良好的能力被称为泛化。模型在未知的新输入数据上得到的误差称为泛化误差,或测量误差,我们也希望泛化误差很低。在降低训练误差 阅读全文
posted @ 2020-02-01 12:34 赵代码 阅读(573) 评论(1) 推荐(1) 编辑
摘要: 模型的保存与加载一般有三种模式:save/load weights(最干净、最轻量级的方式,只保存网络参数,不保存网络状态),save/load entire model(最简单粗暴的方式,把网络所有的状态都保存起来),saved_model(更通用的方式,以固定模型格式保存,该格式是各种语言通用的 阅读全文
posted @ 2020-01-31 17:37 赵代码 阅读(1861) 评论(1) 推荐(1) 编辑
摘要: 使用到的API有:keras.Sequential、Layers/Model 1.keras.Sequential 以前的代码已经很多次用到了这个接口,这里直接给出代码: model = Sequential([ layers.Dense(256,activation=tf.nn.relu), # 阅读全文
posted @ 2020-01-31 17:02 赵代码 阅读(450) 评论(1) 推荐(1) 编辑
摘要: 在tf.keras中,metrics其实就是起到了一个测量表的作用,即测量损失或者模型精度的变化。metrics的使用分为以下四步: step1:Build a meter acc_meter = metrics.Accuracy() loss_meter = metrics.Mean() step 阅读全文
posted @ 2020-01-30 21:32 赵代码 阅读(2288) 评论(1) 推荐(1) 编辑
摘要: Fragment是个特别的存在,有点像报纸上的专栏,看起来只占据页面的一小块,但是这一小块有自己的生命周期,可以自行其是,仿佛独立王国,并且这一小块的特性无论在哪个页面,给一个位置就行,添加以后不影响宿主页面的其他区域,去除后也不影响宿主页面的其他区域。每个fragment都有自己的布局文件,依据其 阅读全文
posted @ 2020-01-29 18:44 赵代码 阅读(300) 评论(1) 推荐(1) 编辑
摘要: 单层的感知机结构可写成以下公式: y=XW+b(y = Σxi*wi+b) 这里单层感知机的激活函数改成使用现代化的sigmoid激活函数 # 定义网络结构 x=tf.random.normal([1,3]) w=tf.ones([3,1]) b=tf.ones([1]) y = tf.consta 阅读全文
posted @ 2020-01-28 22:53 赵代码 阅读(292) 评论(1) 推荐(1) 编辑
摘要: 1.MSE(均方误差) MSE是指真实值与预测值(估计值)差平方的期望,计算公式如下: MSE = 1/m (Σ(ym-y'm)2),所得结果越大,表明预测效果越差,即y和y'相差越大 y = tf.constant([1,2,3,0,2]) y = tf.one_hot(y,depth=4) y 阅读全文
posted @ 2020-01-27 15:04 赵代码 阅读(2881) 评论(1) 推荐(1) 编辑
摘要: 对于神经网络的全连接层,前面已经使用矩阵的运算方式实现过,本篇将引入tensorflow中层的概念, 正式使用deep learning相关的API搭建一个全连接神经网络。下面是全连接神经网络的结构图 其中,x1,x2,x3为输入,a1,a2,a3为输出,运算关系如下: x1,x2,x3所在的层叫神 阅读全文
posted @ 2020-01-27 13:23 赵代码 阅读(8718) 评论(1) 推荐(1) 编辑
摘要: 本篇涉及的内容主要有小型常用的经典数据集的加载步骤,tensorflow提供了如下接口:keras.datasets、tf.data.Dataset.from_tensor_slices(shuffle、map、batch、repeat),涉及的数据集如下:boston housing、mnist/ 阅读全文
posted @ 2020-01-26 19:45 赵代码 阅读(1843) 评论(1) 推荐(1) 编辑
上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页