要想彻底搞清楚这款开源OCR软件的来龙去脉,还得看Google开源项目的说明:http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3,在这里我就不过多详细的说明了。要训练一个新的语言(自定义语言或者某种自然语言都可以)对应的traineddata文件,需要产生下列过程文件:• lang.config• lang.unicharset• lang.unicharambigs• lang.inttemp• lang.pffmtable• lang.normproto• lang.punc-dawg• lang.word-dawg Read More
posted @ 2012-06-03 22:08 血舞&葬青衣 Views(2077) Comments(1) Diggs(0) Edit