摘要:
0 - 背景 今年来卷积网络在计算机视觉任务上取得的显著成果,但仍然存在一些问题。去年Hinton等人提出了使用动态路由的新型网络结构——胶囊网络来解决卷积网络的不足,该新型结构在手写体识别以及小图像分类上取得了不错的效果。其成功的原因在于它使用了动态路由算法替代了卷积网络中的池化层从而减少了信息的 阅读全文
摘要:
0 - 步骤 参考官网,选择好环境配置按照给定命令安装即可。 1 - 参考资料 https://pytorch.org/ 阅读全文
摘要:
0 - 背景 R-CNN中检测步骤分成很多步骤,fast-RCNN便基于此进行改进,将region proposals的特征提取融合成共享卷积层问题,但是,fast-RCNN仍然采用了selective search来进行region proposals的预测,者称为性能的瓶颈(selective 阅读全文
摘要:
0 - 步骤 在命令行中执行下述命令: 1 - 参考资料 https://blog.csdn.net/fxjzzyo/article/details/80216084 阅读全文
摘要:
扫码关注下方公众号:"Python编程与深度学习",领取配套学习资源,并有不定时深度学习相关文章及代码分享。 0 - 背景 经典的R-CNN存在以下几个问题: 训练分多步骤(先在分类数据集上预训练,再进行fine-tune训练,然后再针对每个类别都训练一个线性SVM分类器,最后再用regressor 阅读全文
摘要:
0 - 背景 在目标检测任务中,我们希望输入一副图像,输出目标所在的位置以及目标的类别。最常用的算法是滑动窗口方法,但滑动窗口其实相当于穷举图像中的所有子图像,其效率低且精度也受限。该论文提出一种新的生成目标检测框的方法selective search。 1 - 算法流程 step 0:生成区域集R 阅读全文
摘要:
0 - 背景 该论文是2014年CVPR的经典论文,其提出的模型称为R-CNN(Regions with Convolutional Neural Network Features),曾经是物体检测领域的state-of-art模型。 1 - 相关知识补充 1.1 - Selective Searc 阅读全文
摘要:
0 - 背景 Facebook AI Research(FAIR)开源了一项将2D的RGB图像的所有人体像素实时映射到3D模型的技术(DensePose)。支持户外和穿着宽松衣服的对象识别,支持多人同时识别,并且实时性良好。 本研究的目的是通过建立从人体的2D图像到基于表面的3D表征的密集对应(de 阅读全文
摘要:
0 - 定义 $Sigmoid$函数是一个在生物学中常见的S型函数,也称为$S$型生长曲线。在信息科学中,由于其单增以及反函数单增等性质,$Sigmoid$函数常被用作神经网络的阈值函数,将变量映射到0,1之间。 其曲线如下图: 1 - 导数 $$\begin{align*}sigmoid^{'}( 阅读全文
摘要:
0 - 定义 $tanh$是双曲函数中的一个,$tanh()$为双曲正切。在数学中,双曲正切“$tanh$”是由基本双曲函数双曲正弦和双曲余弦推导而来。 $$tanhx=\frac{sinhx}{coshx}=\frac{e^x-e^{-x}}{e^x+e^{-x}}$$ 其曲线如下图所示: 1 - 阅读全文
摘要:
0 - 学习目标 我们将实现一个简单的3层神经网络,我们不会仔细推到所需要的数学公式,但我们会给出我们这样做的直观解释。注意,此次代码并不能达到非常好的效果,可以自己进一步调整或者完成课后练习来进行改进。 1 - 实验步骤 1.1 - Import Packages 1.2 - Generating 阅读全文
摘要:
0 - 背景 Geoffrey Hinton是深度学习的开创者之一,反向传播等神经网络经典算法发明人,他在去年年底和他的团队发表了两篇论文,介绍了一种全新的神经网络,这种网络基于一种称为胶囊(capsule)的结构,并且还发表了用来训练胶囊网络的囊间动态路由算法。 1 - 研究问题 传统CNN存在着 阅读全文
摘要:
0 - 同步&异步 同步和异步关注的是消息通信机制。 0.1 - 同步 由“调用者”主动等待这个“调用”结果。即是,发出一个“调用”时,在没有得到结果之前,该“调用”不返回,一旦调用返回,则得到返回值。 0.2 - 异步 “调用者”不主动等待“调用”结果,而是“调用”结束之后主动通知“调用者”(通过 阅读全文
摘要:
0 - 相关概念 0.1 - 匈牙利算法 匈牙利算法是由匈牙利数学家Edmonds于1965年提出,因而得名。匈牙利算法是基于Hall定理中充分性证明的思想,它是二部图匹配最常见的算法,该算法的核心就是寻找增广路径,它是一种用增广路径求二分图最大匹配的算法。 0.2 - 二分图 若图$G$的结点集合 阅读全文
摘要:
0 - 人体姿态识别存在的挑战 图像中的个体数量、尺寸大小、位置均未知 个体间接触、遮挡等影响检测 实时性要求较高,传统的自顶向下方法运行时间随着个体数越多而越长 1 - 整体思路 整个模型架构是自底向上的,先识别出关键点和关节域,然后通过算法组合成个体的姿势图。 1.1 - 求所有关键点(头部,肩 阅读全文
摘要:
0 - Abstract 我们提出了一种方法去在一张图片中有效地识别多个人体的2D姿势。这个方法使用了一个无参数表示法,我们将其叫为Part Affinity Fields(PAFs),其是去在图片中根据个体识别身体各部分的联合。这个架构编码了全体信息,并且允许一个贪婪的从底向上的解析步骤,这在实现 阅读全文
摘要:
0 - DataSet http://www.csc.kth.se/~att/Site/Animals.html 1 - Code 1.1 - Import Packages 1.2 - Initialize Parameters 1.3 - Build Data Reader 1.4 - Buil 阅读全文
摘要:
0 - Abstract 深度神经网络(DNNs)最近在图像分类任务上表现出了突出的性能。在这篇文章中,我们进一步深入探究使用DNNs进行目标检测的问题,这个问题不仅需要对物体进行分类,并且还需要对各种各样类别的物体进行精确定位。我们提出了简单但依然有效的将目标检测问题形式化为回归问题从而来对物体边 阅读全文
摘要:
新学期开始,想养成阅读论文的习惯。下一阶段的学习以深度学习为主,因此收集深度学习相关论文进行学习。 转载自https://www.cnblogs.com/guoyaohua/p/8533910.html 阅读全文
摘要:
0 - 解决方法 打开Preferences->Settings 在弹出的Settings对话框中,加入"dpi_scale": 1.0 重新启动sublime text 3即可 1 - 原因 根据解决方法,以及重启后正确显示中文文件夹的字体普遍变小,我猜想这个解决方案是将目录的默认字体缩小,而本来 阅读全文
摘要:
0 - ABSTRACT 在这个工作中,我们研究了卷积网络的深度对于它在大规模图像识别设置上的准确率的效果。我们的主要贡献是对使用非常小的卷积核(3×3)来增加深度的网络架构进行彻底评估,这说明了通过将深度增加到16-19层能够比之前最好的业界水平更好。这些发现是我们参加ImageNet Chall 阅读全文
摘要:
0 - TensorFlow 基于数据流图,节点表示某种抽象计算,边表示节点之间联系的张量。 Tensorflow结构灵活,能够支持各种网络模型,有良好的通用性和扩展性。 1 - 系统概述 TensorFlow以$C\ API$为界限,分为前端系统(提供编程模型,负责构造计算图)以及后端系统(提供运 阅读全文
摘要:
前段时间看了YOLO的论文,打算用YOLO模型做一个迁移学习,看看能不能用于项目中去。但在实践过程中感觉到对于YOLO的一些细节和技巧还是没有很好的理解,现学习其他人的博客总结(所有参考连接都附于最后一部分“参考资料”),加入自己的理解,整理此学习笔记。 概念补充:mAP:mAP是目标检测算法中衡量 阅读全文
摘要:
0 - 下载安装包 推荐到清华镜像下载。我选择的是Anaconda3-5.1.0-Linux-x86_64.sh。 1 - 安装Anaconda 然后切换到安装包目录,执行下面命令,期间一直按回车或者输入yes即可。 2 - 测试Anaconda是否安装成功 输入如下命令,出现下图则表明安装成功。 阅读全文
摘要:
0 - ABSTRACT 许多计算机任务在缺少上下文信息的情况下的处理会更加困难。例如,在多相机跟踪任务下,行人可能在不同照相机下面因为有这不同的姿势和灯光条件而看起来很不一样。类似地,在低分辨率高角度监控视频中,头部方向评估也是一个挑战。如果没有上下文信息,人们在处理此类任务时会有很大麻烦。在我们 阅读全文
摘要:
0 - 环境 操作系统: Windows 10 + Ubuntu 16.04 显卡: GTX 950M Cuda 9.0 cudnn v7.0 tensorflow-gpu==1.7.0 1 - ubuntu镜像推荐下载源 中科大源 http://mirrors.ustc.edu.cn/ubuntu 阅读全文
摘要:
1 - 安装Sublime Text 3 到官网下载对应的版本,如下: OS X (10.7 or later is required) Windows - also available as a portable version Windows 64 bit - also available as 阅读全文
摘要:
0 - 摘要 我们提出了YOLO,一种新的物体检测方法。之前的物体检测工作是通过重新使用分类器来进行检测。相反,我们将对象检测抽象为一个回归问题,描述为以空间分隔的边界框和相关的类别概率。一个简单的神经网络通过对完整图片的一次检验直接预测出边界框和分类类别。因为整个识别的依据是一个单一的网络,所以可 阅读全文
摘要:
0 - 摘要 我们训练了一个大型的、深度卷积神经网络用来将ImageNet LSVRC-2010竞赛中的120万高分辨率的图像分为1000个不同的类别。在测试集上,我们在top-1和top-5上的错误率分别为37.5%和17.0%,这比当前最好的技术好得多。这个拥有6000万参数和65万神经元的神经 阅读全文
摘要:
1 - Task Implement the neural style transfer algorithm Generate novel artistic images using your algorithm 2 - Import Packages 3 - Problem Statement 4 阅读全文
摘要:
1 - Task Implement the triplet loss function Use a pretrained model to map face images into 128-dimensional encodings Use these encodings to perform f 阅读全文
摘要:
自己有一个学生云服务器,闲置没有用处,想着以后会有实验室或者多个电脑终端的文件共享问题,可以通过搭建自己的git服务器解决,于是动手开干。 1 - 环境 阿里云云翼计划学生云服务器一台 ubunto 16.04系统 2 - 步骤 2.1 - 安装git 2.2 - 开启ssh服务 通过下面命令查看系 阅读全文
摘要:
1 - Import Packages 2 - Problem Statement 感谢drive.ai提供的数据集,这是一家研究自动驾驶汽车大脑的公司。 这些图像保存在文件夹下面,并且他们都已经被标注上了bounding boxes,这些bounding boxes框出了汽车所在区域,下面是一个样 阅读全文
摘要:
1 - 引入 在我学习吴恩达老师Deeplearning.ai深度学习课程的时候,老师在第四讲卷积神经网络第二周深度卷积网络:实例探究的2.5节网络中的网络以及1×1卷积对1×1卷积做了较为详细且通俗易懂的解释。现自己做一下记录。 2 - 1×1卷积理解 假设当前输入张量维度为6×6×32,卷积核维 阅读全文
摘要:
1 - Import Packages 2 - The problem of very deep neural networks 更深的网络可以表示更复杂的函数,可以学习更多层次上的特征表示。但深层网络存在梯度消失或者梯度爆炸问题。随着训练的进行,可以看到网络前面的网络层的梯度迅速下降为0。构建$R 阅读全文
摘要:
1 - Import Packages 2 - The Happy House 2.1 - Dataset Description 2.2 - Normalize the dataset and learn about its shape 图像大小为(64, 64, 3),训练集有600张图像,测试 阅读全文
摘要:
1.0 - TensorFlow model 导入相关依赖包。 初始化全局变量。 导入数据集。 输出一张样例图片预览。 Result: y = 2 Result: y = 2 Result: y = 2 Result: y = 2 Result: y = 2 Result: y = 2 数据预处理。 阅读全文
摘要:
1 - Import Packages 2 - Global Parameters Setting 3 - Convolutional Neural Networks 3.1 - Zero-padding 对输入张量X指定pad大小,对其进行zero的填充。运用numpy模块中的pad方法可以简单的 阅读全文
摘要:
深度神经网络(Deep Neural Networks,简称DNN)是深度学习的基础。 回顾监督学习的一般性问题。假设我们有$m$个训练样本$\{(x_1, y_1), (x_2, y_2), …, (x_m, y_m)\}$,其中$x$为输入向量,$y$为输出向量,利用这个训练样本训练模型的参数, 阅读全文