CASIA-OLHWDB1.0-1.2数据集解析
OLHWDB1.0-1.2提供联机手写单字数据。
OLHWDB1.0收录汉字3866个,字母数字及符号171个。其中,GB2312-80一级集(共3755个字符)收录汉字3740个。
OLHWDB1.1收录GB2312-80一级集汉字3755个,字母数字及符号171个。
OLHWDB1.2收录汉字3319个,字母数字及符号171个。OLHWDB1.2的汉字集(3319类)与OLHWDB1.0的汉字集不相交。
OLHWDB1.0与OLHWDB1.2共收录汉字7185个(7185=3866+3319),涵盖了GB2312中全部6763个汉字。
数据组织形式如下,使用.pot文件存储。(需要注意的是,TagCode的存储方式和HWDB的不同,注意读取时大小端方式。)