会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
花自盛开
博客园
首页
新随笔
联系
订阅
管理
2019年5月12日
【OCR技术系列之三】大批量生成文字训练集
摘要: 到周末了,终于可以继续可以静下心写一写OCR方面的东西。上次谈到文字的切割,今天打算总结一下我们怎么得到用于训练的文字数据集。如果是想训练一个手写体识别的模型,用一些前人收集好的手写文字集就好了,比如中科院的这些数据集。但是如果我们只是想要训练一个专门用于识别印刷汉字的模型,那么我们就需要各种印刷字
阅读全文
posted @ 2019-05-12 23:15 风骚的小柴犬
阅读(755)
评论(0)
推荐(2)
编辑
公告