摘要: 之前有点好奇有道词典中的OCR功能,具体来说就是强力取词功能。我知道的最有名的OCR库是tesseract,这个库是惠普在早些年前开源的。 在用python做爬虫处理验证码的时候,就会用到这个库,对应的python封装版本名字叫pytesseract。在github上可以找到tesseract的源码 阅读全文
posted @ 2017-05-27 22:12 星云的彼岸 阅读(2137) 评论(0) 推荐(1) 编辑