06 2013 档案

摘要:Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。Tesseract最初由HP公司开发,后来由Google维护,目前发布在Googel Project上。地址为http://code.google.com/p/tesseract-ocr/。使用默认的语言库识别1.安装Tesseract 从http://code.google.com/p/tesseract-ocr/downloads/list下载Tesseract,目前版本为Tessera... 阅读全文
posted @ 2013-06-27 17:42 Sam Lin 阅读(50305) 评论(3) 推荐(1)

点击右上角即可分享
微信分享提示