1. 首先找到的是TensorFlow的 MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片
http://www.tensorfly.cn/tfdoc/tutorials/mnist_beginners.html
http://yann.lecun.com/exdb/mnist/
http://www.cnblogs.com/vipyoumay/p/7507149.html
但这个只是适合算法的比拼而已, 我需要的是任意一张手写的图片,识别出来里面的数字变成文本
2. 找一下OCR软件排名
https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software
http://blog.csdn.net/wenhao_ir/article/details/52213224
https://github.com/tesseract-ocr/tesseract
下载了tesseract 3.0.2 试了试, 还是很垃圾
#强制只识别数字 tesseract.exe f:\ocr\11a.jpg 11a nobatch digits
3. 印象中钉钉的名片识别,准确率挺高的. 我照着名片的格式,自己手写一张名片, 用钉钉识别.
中文,只要你写得工整,基本都能识别, 反而电话号码手写的识别不了. 这让我挺意外的,10个数字和几千个汉字的对比啊.
4. 百度AI开放平台,大数据的平台,识别率比开源的OCR好太多了。
http://ai.baidu.com/tech/ocr/general