摘要: 放假了,终于可以继续可以静下心写一写OCR方面的东西。上次谈到文字的切割,今天打算总结一下我们怎么得到用于训练的文字数据集。如果是想训练一个手写体识别的模型,用一些前人收集好的手写文字集就好了,比如中科院的 "这些数据集" 。但是如果我们只是想要训练一个专门用于识别印刷汉字的模型,那么我们就需要各种 阅读全文
posted @ 2018-02-09 21:07 最难不过二叉树 阅读(37169) 评论(21) 推荐(18) 编辑