iOS OCR
身份证识别,又称 OCR 技术。OCR 技术是光学字符识别的缩写,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
一、实现原理及步骤
灰度化处理
将指定图片每个像素点的 RGB 三个分量通过一定的算法计算出该像素点的灰度值,使图像只含亮度而不含色彩信息。
二值化
将经过灰度化处理的图片转换为只包含黑色和白色两种颜色的图像,他们之间没有其他灰度的变化。在二值图中用 255 便是白色,0 表示黑色
腐蚀
将得到的二值图中的黑色块进行放大。即连接图片中相邻黑色像素点的元素。通过腐蚀可以把身份证上的身份证号码连接在一起形成一个矩形区域。
轮廊检测
图片经过腐蚀操作后相邻点会连接在一起形成一个大的区域,这个时候通过轮廊检测就可以把每个大的区域找出来,这样就可以定位到身份证上面号码的区域。
图像文字识别
将图像信息转化为可以使用的计算机输入技术。
二、开源库
- OpenCV
OpenCV 是一个开源的跨平台计算机视觉和机器学习库,通俗点的说,就是它给计算机提供了一双眼睛,一双可以从图片中获取信息的眼镜,从而完成人脸识别、身份证识别、去红眼、追踪移动物体等等的图像相关的功能
- TesseractOCRiOS
Tesseract 是目前可用的最准确的开源 OCR 引擎,可以读取各种格式的图片并将他们转换成各种语言文本。而 TesseractOCRiOS 则是针对 iOS 平台封装的 Tesseract 引擎库。