2012 年 6月 3 日随笔档案 - 血舞&葬青衣

2012年6月3日

要想彻底搞清楚这款开源OCR软件的来龙去脉，还得看Google开源项目的说明：http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3，在这里我就不过多详细的说明了。要训练一个新的语言（自定义语言或者某种自然语言都可以）对应的traineddata文件，需要产生下列过程文件：• lang.config• lang.unicharset• lang.unicharambigs• lang.inttemp• lang.pffmtable• lang.normproto• lang.punc-dawg• lang.word-dawg Read More

posted @ 2012-06-03 22:08 血舞&葬青衣 Views(2077) Comments(1) Diggs(0) Edit

血舞&葬青衣

公告