摘要: 在深度学习在图像识别任务上大放异彩之前,词袋模型Bag of Features一直是各类比赛的首选方法。首先我们先来回顾一下PASCAL VOC竞赛历年来的最好成绩来介绍物体分类算法的发展。 从上表我们可以发现,在2012年之前,词袋模型是VOC竞赛分类算法的基本框架,几乎所有算法都是基于词袋模型的 阅读全文
posted @ 2017-12-24 09:49 最难不过二叉树 阅读(9302) 评论(10) 推荐(4) 编辑
摘要: 读研半年以来,逐渐了解了学校对学生的培养是怎么样的,同时我把现在的学校做的一些举措跟我本科的学校做了下对比,顿时感慨良多:名校与普通学校的对学生的培养真的非常不一样。我本科是普通一本,研究生读的是一所很不错的985。读研以来,身边发生的一些事,见过的一些人,都让我深深地感受到,名校与普通学校对学生的 阅读全文
posted @ 2017-12-23 00:31 最难不过二叉树 阅读(7809) 评论(16) 推荐(14) 编辑
摘要: 我们一般用深度学习做图片分类的入门教材都是MNIST或者CIFAR 10,因为数据都是别人准备好的,有的甚至是一个函数就把所有数据都load进来了,所以跑起来都很简单,但是跑完了,好像自己还没掌握图片分类的完整流程,因为他们没有经历数据处理的阶段,所以谈不上走过一遍深度学习的分类实现过程。今天我想给 阅读全文
posted @ 2017-12-17 12:10 最难不过二叉树 阅读(41463) 评论(47) 推荐(11) 编辑
摘要: 要做文字识别,第一步要考虑的就是怎么将每一个字符从图片中切割下来,然后才可以送入我们设计好的模型进行字符识别。现在就以下面这张图片为例,说一说最一般的字符切割的步骤是哪些。 当然,我们实际上要识别的图片很可能没上面那张图片如此整洁,很可能是倾斜的,或者是带噪声的,又或者这张图片是用手机拍下来下来的, 阅读全文
posted @ 2017-12-12 20:41 最难不过二叉树 阅读(49963) 评论(10) 推荐(16) 编辑
摘要: 最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解。所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解。 什么是OCR? OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利 阅读全文
posted @ 2017-11-29 22:12 最难不过二叉树 阅读(50143) 评论(12) 推荐(24) 编辑
摘要: 好久没写博客了,因为最近都忙着赶项目和打比赛==| 好吧,今天我打算写一篇关于使用opencv做皮肤检测的技术总结。那首先列一些现在主流的皮肤检测的方法都有哪些: 1. RGB color space 1. Ycrcb之cr分量+otsu阈值化 1. YCrCb中13395 AND G 40 B 2 阅读全文
posted @ 2017-11-20 23:45 最难不过二叉树 阅读(36538) 评论(2) 推荐(15) 编辑
摘要: 直方图均衡化在图像增强方面有着很重要的应用。一些拍摄得到的图片,我们从其直方图可以看出,它的分布是集中于某些灰度区间,这导致人在视觉上感觉这张图的对比度不高。所以,对于这类图像,我们可以通过直方图均衡技术,将图像的灰度分布变得较为均匀,从而使得图像对比度增大,视觉效果更佳。 直方图均衡化的代码实现有 阅读全文
posted @ 2017-11-01 16:13 最难不过二叉树 阅读(21880) 评论(3) 推荐(0) 编辑
摘要: 最近在做票据识别的编码工作时遇到一些问题,就是票据上往往会有一些红色印章把一些重要信息区域给覆盖了,比如一些开发票人员盖印章时比较随意,容易吧一些关键区域给遮蔽了,这让接下来的票据识别很困难,因此,我们必须先对票据图像进行一定的预处理来移除印章干扰,再进行字符识别,这样子识别准确率才有保证。 我们从 阅读全文
posted @ 2017-10-08 19:50 最难不过二叉树 阅读(18456) 评论(9) 推荐(5) 编辑
摘要: 搞图像深度学习的童鞋一定碰过图像数据标注的东西,当我们训练网络时需要训练集数据,但在网上又没有找到自己想要的数据集,这时候就考虑自己制作自己的数据集了,这时就需要对图像进行标注。图像标注是件很枯燥又很费人力物力的一件事情,但是又不能回避,毕竟搞深度学习如果没有数据集那一切都是瞎搞。最近我在参加一个有 阅读全文
posted @ 2017-09-30 00:19 最难不过二叉树 阅读(13185) 评论(8) 推荐(3) 编辑
摘要: 图像灰度级数我们见得最多的就是256了,如果想调整它的灰度级数,我们可以使用图像库的imadjust函数来作出调整,比如讲256个灰度级变成2个灰度级(也就是二值图了)。再举一个例子,原来一幅256个灰度级的图像,如果我们把它的灰度级重新调整为4,那么调整后这幅图像的灰度值应该就是有4个值:0,85 阅读全文
posted @ 2017-09-24 12:11 最难不过二叉树 阅读(5967) 评论(1) 推荐(2) 编辑