摘要: 经过前面的文字定位和文本切割,我们已经能够找出图像中单个文字的区域,接下来可以建立相应的模型对单字进行识别。 模型选择 在模型方面,我们选择了深度学习中的卷积神经网络模型,通过多层卷积神经网络,构建了单字的识别模型。 卷积神经网络是人工神经网络的一种,已成为当前图像识别领域的主流模型。 它通过局部感 阅读全文
posted @ 2017-02-06 10:58 萨姆大叔 阅读(3166) 评论(0) 推荐(0) 编辑
摘要: 文字定位 经过前面的特征提取,我们已经较好地提取了图像的文本特征,下面进行文字定位。 主要过程分两步: 1、邻近搜索,目的是圈出单行文字; 2、文本切割,目的是将单行文本切割为单字。 邻近搜索 我们可以对提取的特征图进行连通区域搜索,得到的每个连通区域视为一个汉字。 这对于大多数汉字来说是适用,但是 阅读全文
posted @ 2017-02-06 10:48 萨姆大叔 阅读(10153) 评论(0) 推荐(0) 编辑
摘要: 研究背景 关于光学字符识别(Optical Character Recognition, 下面都简称OCR),是指将图像上的文字转化为计算机可编辑的文字内容,众多的研究人员对相关的技术研究已久,也有不少成熟的OCR技术和产品产生,比如汉王OCR、ABBYY FineReader、Tesseract 阅读全文
posted @ 2017-02-06 10:11 萨姆大叔 阅读(14951) 评论(2) 推荐(2) 编辑
摘要: 在现代社会中,信息安全对于每一个人都是至关重要的,例如我们的银行账户安全、支付宝和微信账户安全、以及邮箱等等,说到信息安全,那就必须得提到加密技术,至于加密的一些相关概念,在这里就不说了。 这一次将会主要讲解.NET的加密方式,接下来将会分别介绍散列加密,对称加密,非对称加密等等加密方式在.NET中 阅读全文
posted @ 2017-02-04 10:22 萨姆大叔 阅读(1126) 评论(0) 推荐(0) 编辑
摘要: Git在版本控制方面,相比与SVN有更多的灵活性,对于开源的项目,我们可以托管到Github上面,非常方便,但是闭源的项目就会收取昂贵的费用。 那么私有项目,如何用Git进行代码版本控制呢?我们可以自己构建Git服务器。一般来说,在Linux上搭建Git的教程比较多,但是如何在Windows Ser 阅读全文
posted @ 2017-02-03 15:07 萨姆大叔 阅读(59913) 评论(3) 推荐(12) 编辑
摘要: 1简介 感知机(或称感知器,Perceptron)是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络 它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类模型,其输入为实例的 阅读全文
posted @ 2017-01-23 11:18 萨姆大叔 阅读(1359) 评论(0) 推荐(0) 编辑
摘要: 在之前的一篇文章《放好你的密码 - 从芝麻金融被攻破说起》中,一位读者在评论中提出了“如果整个过程速度比较慢登陆会有问题”这样一条评论。虽然说我对文章的正确性很有把握,但也仍需要仔细思考是否自己哪里没有说清楚。在这个思考过程中,我想起了一个非常值得一说的话题,那就是负载平衡。 在那篇文章中我们说到, 阅读全文
posted @ 2017-01-22 14:47 萨姆大叔 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,由于算法的简单和高效,在实际中应用非常广泛。本文作为美团机器学习InAction系列中的一篇,主要关注逻辑回归算法的数学模型和参数求解方法,最后也会简单讨论下逻辑回归和贝叶斯分类的关系,以及在多分类问题上的推广。 逻辑回归 阅读全文
posted @ 2017-01-22 14:31 萨姆大叔 阅读(1020) 评论(0) 推荐(1) 编辑
摘要: 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一 阅读全文
posted @ 2017-01-22 11:38 萨姆大叔 阅读(778) 评论(0) 推荐(0) 编辑
摘要: 最近接了一个任务,就是做一个列表的Excel导出功能。并且有很多页面都会使用这个功能。 导出的Excel大体格式如图 很简单的列表,标题加背景色,然后不同类型,显示方式不一样。对齐方式不一样。不同页面除了内容以外,大体形式都差不多。 当时本来是想直接用NPOI,IRow ICell。这样进行拼接页面 阅读全文
posted @ 2017-01-22 11:12 萨姆大叔 阅读(1298) 评论(3) 推荐(0) 编辑