上一页 1 2 3 4 5 6 ··· 8 下一页
摘要: 深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第六篇,简要描述深度神经网络模型。1. 自联想神经网络与深度网络 自联想神经网络是很古老的神经网络模型,简单的说,它就是三层BP网络,只不过它的输出等于输入。很多时候我们并不要求输出精确的等于输入,而是允许一定的误差存在。所以,我们说,输出是对输入的一种重构。其网络结构可以很简单的表示如下: 如果我们在上述网络中不使用sigmoid函数,而使用线性函数,这就是PCA模型。中间网络节... 阅读全文
posted @ 2013-06-12 17:40 celerychen 阅读(754) 评论(0) 推荐(0) 编辑
摘要: 图像去噪是一个经典的课题。然而,对于真实数码照片,要想达到良好的去噪效果,且非易事。尤其是对于手机拍摄的照片,更是如此。如果你在光线不好的环境下,用手机前置摄像头拍照,往往会有很多的噪声。 我们可以在任何一本关于数字图像处理的教材上找到多种图像去噪的方法。但是,这些经典的方法,对于真实图像去噪的效果很不好。这些方法都会让图像变得模糊而导致很差的视觉效果。尽管用双边滤波可以达到较高的信噪比,但是其视觉效果依然很差。 后来,人们提出了一种有效的去噪算法,这就是非局部均值。非局部均值是一种基于快匹配来确定滤波权值的。即先确定一个块的大小,例如7x7,然后在确定一个搜索区域,例如1... 阅读全文
posted @ 2013-06-11 16:23 celerychen 阅读(1918) 评论(1) 推荐(0) 编辑
摘要: 对于搞图像处理的人而言,不懂变分法,基本上,就没法读懂图像处理的一些经典文献。当然,这已经是10年之前的事情了。 现在,如果不懂得Bregman迭代算法,也就没法读懂最近几年以来发表的图像处理的前沿论文了。国内的参考文献,基本上都是直接引用Bregman迭代算法本身,而对于其原理基本上找不到较为详细的论述。本文简要叙述当前流行的Bregman迭代算法的一些原理。 1. 简介 近年来,由于压缩感知的引入,L1正则化优化问题引起人们广泛的关注。压缩感知,允许通过少量的数据就可以重建图像信号。L1正则化问题是凸优化中的经典课题,用传统的方法难以求解。我们先从经典的图像复原问题引入... 阅读全文
posted @ 2013-06-08 17:59 celerychen 阅读(1825) 评论(0) 推荐(0) 编辑
摘要: 深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第五篇,谈谈PCA模型。本来PCA模型与深度学习是没有任何联系的。通常我们只是用PCA来对机器学习的数据做预处理。本来想详细记录一下PCA的原理,但网上已经有一篇不错的文章,链接如下:http://hi.baidu.com/ifengzh/item/8851b6387aebefc4382ffa60本文前面部分内容引用了这篇文章的内容。一、简介 PCA(Principal Components Analysis)即主成分分析,是图像处理中经常用到.. 阅读全文
posted @ 2013-06-07 15:29 celerychen 阅读(581) 评论(0) 推荐(0) 编辑
摘要: 在传统的图像,视频的后处理阶段,一般会涉及到图像大小的缩放问题。这样的操作是为了适配不同屏幕分辨率的大小。例如,对于高档相机拍摄的照片,一般都很大,而要在普通显示器上显示,则要在解码图像数据之后再做缩小操作才能显示到屏幕上。对于手机屏幕,更是如此。那么,能否在图像解码的过程中实现图片的缩小?答案是肯定的。网上开源的jpeg项目早就实现了频域下采样技术。美图秀秀,QQlive等多款桌面图片应用软件也采用了这项技术,并宣称对大图的加载速度快了好几倍。不过,QQlive居然直接使用了这个库! 通过在视频解码中使用频域下采样技术,我们在400M主频的手机上实现了720p的流畅解码,在4... 阅读全文
posted @ 2013-06-05 10:20 celerychen 阅读(2222) 评论(0) 推荐(0) 编辑
摘要: 深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第四篇,谈谈我对逻辑回归和softmax回归的一点理解。网络上对逻辑回归和softmax回归论述也很多,包括各种不同语言的代码,都可以下载到。1. 逻辑回归源于线性回归模型。 线性回归问题的自变量是连续变量,而逻辑回归问题的自变量一般是取值为离散的名义变量,例如,男,女。逻辑回归是对因变量和自变量之前发生关系的概率解释。例如,某种疾病的发生与抽烟的关系,这种关系可以解释为抽烟会导致这种疾病发生的概率值。当逻辑回归用于分类的时候,分类器的阈值点就是. 阅读全文
posted @ 2013-06-03 17:15 celerychen 阅读(1646) 评论(0) 推荐(0) 编辑
摘要: 摘要:我们提出了一种从单一图片去除运动模糊的算法。我们的方法在去模糊图像的计算过程中,对于卷积核的估计和清晰图像,采用统一的概率模型。我们分析了当前去模糊方法中通常存在的人工痕迹的产生原因,而后在我们的概率模型中引入了一些新的术语。这些术语包括模糊图像噪声的空域随机模型,还有新的局部平滑先验知识。通过对比度约束,即使是低对比的模糊图像,也能减少人工振铃效应。最后,我们描述了一种有效的优化方案,通过交替估计模糊核和清晰图像的复原过程直到收敛。经过这些步骤,我们能够在一个低的计算复杂度的时间内获得一个高质量的清晰图像。我们的方法生成的图像质量相当于用多张模糊图片生成的清晰图片的效果,而后者的方法需 阅读全文
posted @ 2013-06-01 10:16 celerychen 阅读(765) 评论(0) 推荐(0) 编辑
摘要: 摘要 我们提出了一种简单而高效的上采样方法。这种方法能够自动的增强视频图像的分辨率,同时能够保持图像的重要结构信息。我们的方法主要优点在于一个反馈控制框架,这个框架能够从低分辨率图像确切地复原高分辨率图像,而不需要强加从其它样本中学习到的图像的局部结构约束信息。这使得我们的方法在图像质量上与通过大量采样学习得到的高质量图像是独立的。通常大量样本学习的算法,能够产生高质量的图像质量而没有可觉察到的难看的人工痕迹。我们的方法另外一个优点是可以很自然地扩展到视频的上采样中,同时,视频的暂态连续性能够自动的保持。最后,我们的算法运行的很快。我们通过不同的视频图像数据演示了我们的算法的有效性。 注... 阅读全文
posted @ 2013-06-01 09:43 celerychen 阅读(546) 评论(0) 推荐(0) 编辑
摘要: 深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第三篇,谈谈自己对最近几年颇为流行的受限波尔兹曼网络RBM的理解。我不打算详细描述其生物学运行机理和相关的算法推导过程,因为网络上已经有太多的教程可以参考。1. 概述 前面描述的神经网络模型是一种确定的结构。而波尔兹曼网络是一种随机网络。如何来描述一个随机网络呢?很多书上有大量的篇幅介绍其原理。这里把它总结为以下两点。 第一,概率分布函数。由于网络节点的取值状态是随机的,从贝叶斯网的观点来看,要描述整个网络,需要用三种概率分布来描述系... 阅读全文
posted @ 2013-05-28 14:30 celerychen 阅读(395) 评论(0) 推荐(0) 编辑
摘要: 深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第二篇,讲讲经典的卷积神经网络。我不打算详细描述卷积神经网络的生物学运行机理,因为网络上有太多的教程可以参考。这里,主要描述其数学上的计算过程,也就是如何自己编程去实现的问题。1. 概述 回想一下BP神经网络。BP网络每一层节点是一个线性的一维排列状态,层与层的网络节点之间是全连接的。这样设想一下,如果BP网络中层与层之间的节点连接不再是全连接,而是局部连接的。这样,就是一种最简单的一维卷积网络。如果我们把上述这个思路扩展到二维,这就是我们在... 阅读全文
posted @ 2013-05-25 13:42 celerychen 阅读(383) 评论(1) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 8 下一页