摘要:
CRNN是OCR领域非常经典且被广泛使用的识别算法,其理论基础可以参考我 "上一篇文章" ,本文将着重讲解CRNN代码实现过程以及识别效果。 数据处理 利用图像处理技术我们手工大批量生成文字图像,一共360万张图像样本,效果如下: 我们划分了训练集和测试集(10:1),并单独存储为两个文本文件: 文 阅读全文
摘要:
在以前的OCR任务中,识别过程分为两步:单字切割和分类任务。我们一般都会讲一连串文字的文本文件先利用投影法切割出单个字体,在送入CNN里进行文字分类。但是此法已经有点过时了,现在更流行的是基于深度学习的端到端的文字识别,即我们不需要显式加入文字切割这个环节,而是将文字识别转化为序列学习问题,虽然输入 阅读全文
摘要:
真的是光阴似箭,好像昨天还沉浸在考研成功的喜悦,今天却要即将步入2019年,即将硕士毕业。老规矩,还是在每一年的最后一天总结今年以及展望明年。回首2018,经历的东西特别多,视野也开阔了不少,可以说,2018是丰收的一年。如果用三个关键词来描述我的2018,那无疑是:OCR、实习和秋招。 2018是 阅读全文
摘要:
这几天一直在用Pytorch来复现文本检测领域的CTPN论文,本文章将从数据处理、训练标签生成、神经网络搭建、损失函数设计、训练主过程编写等这几个方面来一步一步复现CTPN。CTPN算法理论可以参考 "这里" 。 训练数据处理 我们的训练选择天池ICPR2018和MSRA_TD500两个数据集,天池 阅读全文
摘要:
文字识别分为两个具体步骤:文字的检测和文字的识别,两者缺一不可,尤其是文字检测,是识别的前提条件,若文字都找不到,那何谈文字识别。今天我们首先来谈一下当今流行的文字检测技术有哪些。 文本检测不是一件简单的任务,尤其是复杂场景下的文本检测,非常具有挑战性。自然场景下的文本检测有如下几个难点: 文本存在 阅读全文
摘要:
程序员还是比较喜欢使用谷歌浏览器和谷歌搜索引擎,但是谷歌搜索被墙了啊,自己又没钱买梯子怎么办?谷歌浏览器上有很多自己的书签,但是不知道何时开始,账号就一直登不上,自己的收藏夹没办法同步啊怎么办?不如试试以下办法,贼好用。 材料准备: 1. 最新版chrome 2. 下载扩展程序:链接:https:/ 阅读全文
摘要:
CUDA(Compute Unified Device Architecture)的中文全称为计算统一设备架构。做图像视觉领域的同学多多少少都会接触到CUDA,毕竟要做性能速度优化,CUDA是个很重要的工具,CUDA是做视觉的同学难以绕过的一个坑,必须踩一踩才踏实。CUDA编程真的是入门容易精通难, 阅读全文
摘要:
今天终于要离开北京了,正式结束在Intel的实习生旅程。现在在首都机场写下这4个月来在北京生活、在Intel实习的一些见闻和感悟。 在Intel的实习 4月初的时候拿到了Intel的实习机会,当时还是非常兴奋的,因为毕竟Intel作为世界顶级科技公司,有机会去里面当软件工程师实习生还是一段很有意思的 阅读全文
摘要:
自己一直用的是 C++98 规范来编程,对于 C++11 只闻其名却没用过其特性。近期因为工作的需要,需要掌握 C++11 的一些特性,所以查阅了一些 C++11 资料。因为自己有 C++98 的基础,所以从 C++98 过渡到 C++11 并不算特别吃力,读了一些书籍后,算是对 C++11 有了个 阅读全文
摘要:
假设服务器的硬件资源“充裕”,那么提高服务器性能的一个很直接的方法就是空间换时间,即“浪费”服务器的硬件资源,以换取其运行效率。提升服务器性能的一个重要方法就是采用“池”的思路,即对一组资源在服务器启动之初就被完全创建好并初始化,这称为静态资源分配。当服务器进入正式运行阶段,即开始处理客户端请求时, 阅读全文