摘要: 前几天接到的一个需求,处理一堆doc和pdf,提取相应内容输出到xls里。经过一天的努力,正常的文件都顺利解决。还有一部分pdf是解决不了的,原因是pdf内部文字所使用的编码在本机没有。从pdf中提取出来的内容都会变成!@#$之类的符号(很明显是编码问题)。 试了很多方法,最后无奈选择OCR。 每一 阅读全文
posted @ 2017-03-19 13:17 Kirai 阅读(702) 评论(0) 推荐(0) 编辑
摘要: 大二的时候写的一个CV小玩意,最终决定还是把它放出来,也许会帮助到很多人,代码写的很丑,大家多多包涵。附加实验报告主要部分。大家会给这个课设打多少分呢? 课题背景及意义: 本项目主要目标是设计一套能自动分析我校现行的试卷封面并获取学生题目得分信息以及学号信息的原型系统。 本项目的实现有助于提升我校成 阅读全文
posted @ 2017-03-19 11:37 Kirai 阅读(631) 评论(0) 推荐(0) 编辑