会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
冠军的试炼
悟已往之不谏,知来者之可追
博客园
首页
新随笔
联系
订阅
管理
2018年2月9日
【OCR技术系列之三】大批量生成文字训练集
摘要: 放假了,终于可以继续可以静下心写一写OCR方面的东西。上次谈到文字的切割,今天打算总结一下我们怎么得到用于训练的文字数据集。如果是想训练一个手写体识别的模型,用一些前人收集好的手写文字集就好了,比如中科院的 "这些数据集" 。但是如果我们只是想要训练一个专门用于识别印刷汉字的模型,那么我们就需要各种
阅读全文
posted @ 2018-02-09 21:07 最难不过二叉树
阅读(37169)
评论(21)
推荐(18)
编辑
公告