Processing math: 100%

2024年9月13日

行驶证识别算法以及在中科麒麟系统的离线部署

行驶证作为车辆合法上路的证明文件,包含车辆的基本信息和车主的详细资料,是政府部门、保险公司、租赁公司以及交通管理系统中常用的文档。在日常业务操作中,快速、准确地录入行驶证信息对于提高工作效率、减少人工错误有着重要意义。然而,传统的手工输入过程不仅费时,还存在一定的错误率。为此,OCR(Optical Character Recognition,光学字符识别)技术被广泛应用于行驶证的自动识别中。

OCR技术在行驶证识别中的应用

OCR技术能够通过扫描或拍摄行驶证图像,将其中的文字内容转化为可编辑的文本数据。基于深度学习的现代OCR模型不仅能够识别印刷体和手写体,还能够应对复杂的背景、模糊或不清晰的图片。这使得OCR在行驶证识别场景中具有广泛的应用。

行驶证的结构通常包括:

  • 车辆信息:如品牌型号、发动机号码、车辆识别代码、核定载人数等。
  • 车主信息:如车主姓名、住址、证件号码等。

对于这种多种格式的文本,OCR模型需要具备多字段、多格式的识别能力。相比于传统的手工录入,OCR的优势在于:

  1. 提高效率:OCR能够在几秒钟内自动识别并录入行驶证信息,大幅缩短了信息处理的时间。
  2. 准确性高:通过先进的算法,OCR能够减少人工输入中的错误,提高信息录入的准确度。
  3. 无纸化办公:OCR的应用推动了行驶证信息管理的数字化和无纸化,有助于环保和资源节约。
  4. 可扩展性强:OCR能够与其他系统集成,如车辆管理系统、保险理赔系统等,自动将识别出的数据导入到业务流程中,实现信息的自动化处理。

OCR技术在国产系统中的适应性

在国产化系统的背景下,如麒麟操作系统中部署OCR行驶证识别服务,需要保证技术的安全性和离线部署能力。通过将OCR服务与国产操作系统、硬件环境深度集成,可以确保行驶证信息的本地化处理,避免数据外泄风险,符合国内对敏感信息的安全要求。这种解决方案不仅能确保业务的高效运行,还能在国家安全政策框架下推动数字化转型。

技术方案

行驶证识别可以看作OCR的一个具体应用,整个系统的部署可以参考 https://www.cnblogs.com/xueliangliu/articles/18412436  一般最简单的行驶证识别方法可以采用OCR后处理的方式来完成,即将OCR识别到的结果,通过分析其位置,文本模式等方式,来确定其字段的上下文语义。

比如,以下的代码用来检测行驶证中的证芯编号:

 

    def number(self):
        """
        证芯编号
        """
        numbers = {}
        numbers['行驶证证芯编号'] = "未识别"
        self.res.update(numbers)
        for i in range(int(self.N/4*3), self.N):
            if self.result[i]['box']['cy'] < 0.8 or self.result[i]['box']['cx'] < 0.4 :  
                continue
            txt = self.result[i]['text'].replace(' ', '').replace('.', '').replace('·', '')
            txt = txt.replace(' ', '')
            res = re.findall('[A-Za-z0-9]{8,14}', txt)
            if len(res) > 0:
                numbers['行驶证证芯编号'] = res[0]
                self.res.update(numbers)
                break
            else:
                numbers['行驶证证芯编号'] = "未识别"
                self.res.update(numbers)

 

结果

 

识别结果:

 

 

posted @ 2024-09-13 17:07 xueliangliu 阅读(53) 评论(0) 推荐(0) 编辑

2020年2月6日

深度学习模型在移动端部署方法

摘要: 1. Keras 转 tflite def keras2tflite(keras_model, tflitefile) converter = tf.lite.TFLiteConverter.from_keras_model(model_2) # Indicate that we want to p 阅读全文

posted @ 2020-02-06 11:29 xueliangliu 阅读(2621) 评论(0) 推荐(1) 编辑

2019年4月26日

A Recipe for Training Neural Networks [中文翻译, part 1]

摘要: 最近拜读大神Karpathy的经验之谈 A Recipe for Training Neural Networks https://karpathy.github.io/2019/04/25/recipe/,这个秘籍对很多深度学习算法训练过程中遇到的各自问题进行了总结,并提出了很多很好的建议,翻译于 阅读全文

posted @ 2019-04-26 18:10 xueliangliu 阅读(995) 评论(0) 推荐(0) 编辑

2018年7月27日

使用python创建生成动态链接库dll

摘要: 如今,随着深度学习的发展,python已经成为了深度学习研究中第一语言。绝大部分的深度学习工具包都有python的版本,很多重要算法都有python版本的实现。为了将这些算法应用到具体工程中,这些工具包也提供了不同类型的接口。 动态链接库(.dll,.so)是系统开发中一种非常重要的跨语言协作方式。 阅读全文

posted @ 2018-07-27 09:26 xueliangliu 阅读(84086) 评论(11) 推荐(5) 编辑

2016年10月9日

[tensorflow in a nutshell] tensorflow简明教程 (第一部分)

摘要: 原文链接: https://medium.com/@camrongodbout/tensorflow-in-a-nutshell-part-one-basics-3f4403709c9d#.31jv5ekoy 学习世界上最流行的深度学习框架的最快最简单的教程 (其实这个系列写的差强人意,但是的确是学 阅读全文

posted @ 2016-10-09 20:43 xueliangliu 阅读(1501) 评论(0) 推荐(1) 编辑

2016年2月16日

theano学习指南5(翻译)- 降噪自动编码器

摘要: 降噪自动编码器是经典的自动编码器的一种扩展,它最初被当作深度网络的一个模块使用 [Vincent08]。这篇指南中,我们首先也简单的讨论一下自动编码器。 自动编码器 文献[Bengio09] 给出了自动编码器的一个简介。在编码过程,它可以把输入x[0,1]d映射到一 阅读全文

posted @ 2016-02-16 17:28 xueliangliu 阅读(1898) 评论(1) 推荐(0) 编辑

2013年6月9日

theano学习指南4(翻译)- 卷积神经网络

摘要: 动机 卷积神经网络是一种特殊的MLP,这个概念是从生物里面演化过来的. 根据Hubel和Wiesel早期在猫的视觉皮层上的工作 [Hubel68], 我们知道在视觉皮层上面存在一种细胞的复杂分布,这些细胞对一些局部输入是很敏感的,它们被成为感知野, 并通过这种特殊的组合方式来覆盖整个视野. 这些过滤 阅读全文

posted @ 2013-06-09 10:25 xueliangliu 阅读(5236) 评论(0) 推荐(0) 编辑

2013年4月26日

theano学习指南3(翻译)-多层感知器模型

摘要: 本节要用Theano实现的结构是一个隐层的多层感知器模型(MLP)。MLP可以看成一种对数回归器,其中输入通过非线性转移矩阵Φ做一个变换处理,以便于把输入数据投影到一个线性可分的空间上。MLP的中间层一般称为隐层。单一的隐层便可以确保MLP全局近似。然而,我们稍后还会看到多隐层的好处,比如在深度学习中的应用。(本节只要介绍了MLP的实现,对神经网络的背景知识介绍不多,感兴趣的朋友可以进一步阅读相应教程 - 译者注)MLP模型MLP模型可以用以下的图来表示:单隐层的MLP定义了一个映射:f:RDRL,其中 DL为输入向量和输出向量$f( 阅读全文

posted @ 2013-04-26 13:14 xueliangliu 阅读(5086) 评论(0) 推荐(1) 编辑

2013年4月7日

theano学习指南2(翻译)-对数回归分类器

摘要: 在本章节中,我们会学习如何用Theano实现最基本的对数回归分类器。首先,我们会简单的复习一个这个模型,在这个过程中,大家可以进一步的了解如何把数学表达式和Theano的图模型结合起来。数学模型对数回归模型是试过线性概率分类器,它有两个参数,权重矩阵W和偏移向量b.分类的过程是把数据投影到一组高维超平面上,数据和平面的距离反应了它属于这个类别的概率。这个模型的数学公式可以表示为:P(Y=i|x,W,b)=softmaxi(Wx+b)=eWix+bijeWjx+bj模型的输出即为预测的结果, 阅读全文

posted @ 2013-04-07 20:42 xueliangliu 阅读(7478) 评论(4) 推荐(1) 编辑

2013年4月3日

theano学习指南1(翻译)

摘要: theano学习指南,主要翻译官方文档 基础知识 本学习指南不是一份机器学习的教程,但是首先我们会对其中的概念做一个简单的回顾,以确保我们在相同的起跑线上。大家还需要下载几个数据库,以便于跑这个指南里面的程序。 theano下载安装 在学习每一个算法的时候,大家都需要下载安装相应的文件,如果你想要一 阅读全文

posted @ 2013-04-03 11:07 xueliangliu 阅读(27822) 评论(2) 推荐(7) 编辑

导航

< 2025年4月 >
30 31 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 1 2 3
4 5 6 7 8 9 10
点击右上角即可分享
微信分享提示