摘要: os.getcwd() os.getcwd() 方法用于返回当前工作目录。 用法如下: os.getcwd() sys.argv 获得命令行参数 sys.argv就是一个从程序外部获取参数的桥梁,这个“外部”很关键, 因为我们从外部取得的参数可以是多个,所以获得的是一个列表(list),也就是说sy 阅读全文
posted @ 2018-05-19 18:37 moonok 阅读(412) 评论(0) 推荐(0) 编辑
摘要: 正则表达式 正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。 下图提供了正则表达式的简介写法: 1. 通配符 ?与 + ? 通配符匹配文件名中的 0 个或 1 个字符; + 通配符匹配零个或多个字符。 ps: 阅读全文
posted @ 2018-05-19 17:55 moonok 阅读(186) 评论(0) 推荐(0) 编辑
摘要: ocr之列切分 当得到每一行的图之后,需要进行列投影切分成单个字符,其实现大体如下: 1. 找出列间隔,根据列间隔的index进行分列 2. 对于列切分后得到的每块小图求h,w,scale: 3. 根据scale进行判断: 3.1 去掉图片、竖线、横线 3.2 如果宽高比过低且高度大于10,或高度过 阅读全文
posted @ 2018-05-19 13:33 moonok 阅读(306) 评论(0) 推荐(0) 编辑
摘要: 浅谈ocr 最近在做一个ocr相关的项目,由于是第一次接触图像切割相关工作,有许多一知半解甚者丝毫没思路无从下手的问题,就边做边摸索边学习,现在总结如下: + 项目总体需求是将一张医疗报告或者发票之类的图片上边的文字进行切割,切割成单个字符,再进行文字识别,同时以json格式返回识别结果和文字的坐标 阅读全文
posted @ 2018-05-19 12:46 moonok 阅读(477) 评论(0) 推荐(1) 编辑