2014年11月19日
摘要: Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。Tesseract最初由HP公司开发,后来由Google维护,目前发布在Googel Project上... 阅读全文
posted @ 2014-11-19 11:15 Flameman 阅读(1270) 评论(0) 推荐(0) 编辑