摘要:
为什么要给网络参数赋初值 既然网络参数通过训练得到,那么其初值是否重要?设置初值不佳是否只影响收敛速度而不影响模型结果?网络参数是否可以设置为全0或者全1? 假设网络的参数W初值都是0,如下图所示,无论输入任何X,第一层的输出A将都为0,再向前传递到y也是0,... 阅读全文
摘要:
梯度迭代类算法已成为目前各种领域的主流算法。各种现实中的问题分解抽象成机器可以处理的形式之后,基本都可归类为图像、自然语言处理、决策、时序、强化学习这几种类型,而当今解决这些问题的顶尖算法中,梯度迭代(梯度上升或梯度下降)都占据主流地位,比如决策类问题的比赛中... 阅读全文
摘要:
编程语言和自然语言一样,不理解的词越多,对全文的理解就越差。掌握必要的基础知识,让后期看代码更加流畅。 机器学习需要掌握数据处理工具Pandas、Numpy,同理,深度学习也需要掌握相应的工具,在Pytorch中数据存储在Tensor之中,本篇将介绍它们的基本... 阅读全文
摘要:
介绍 深度学习一般依赖比较复杂的环境,每个项目需要的底层库各有不同,有时在github中下载的代码只能运行在版本较低的的工具链之上。想在一台机器上建立适合所有项目的环境非常困难,大多数情况下使用docker维护不同项目针对的不同环境。 CUDA是NVIDIA推... 阅读全文
摘要:
说明 很多基于Pytorch的工具集都非常好用,比如处理自然语言的torchtext,处理音频的torchaudio,以及处理图像视频的torchvision。 torchvision包含一些常用的数据集、模型、转换函数等等。当前版本0.5.0包括图片分类、语... 阅读全文
摘要:
1. torch.no_grad (1) 用法 with torch.no_grad(): 具体操作 (2) 说明 上例的“具体操作”中均不更新梯度,这样可以节约计算时间和内存。一般用于验证或者测试阶段。 2. param.requires_grad (1)... 阅读全文
摘要:
下例使用torchvision库提取了resnet最后一层的卷积特征;resnet各block的卷积特性,以及金字塔特性。 具体取哪一层特征视使用场景而定,resnet各block的输出包含更丰富的特征;从resnet最后一层提取的特征更为抽象;fpn每层通道... 阅读全文
摘要:
Recall&Precision 引用一个知乎上的例子:某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下:正确率 Precision = 700 / (700... 阅读全文
摘要:
在深度学习和其它一些循环迭代算法中,学习率都非常重要。在效率上,它几乎是与算力同等重要的因素;在效果上,它也决定着模型的准确率。如果设置太小,则收敛缓慢,也有可能收敛到局部最优解;设置太大又导致上下摆动,甚至无法收敛。 设定学习率 下面总结了设置学习率的一些方... 阅读全文
摘要:
上一讲学习了编写网页代码的方法,到目前为止,创建的网页文件只能用浏览器打开。如果需要用同一网络中的其它电脑或者手机访问该页面,则需要搭建HTTP服务。 普通电脑上也可以搭建HTTP服务,成为小型的HTTP服务器,使用Python搭建HTTP服务非常简单,不需要... 阅读全文