06 2019 档案

摘要:刚学到爬虫识别验证码,所以自己建一个获取验证码的类,感兴趣的道友,可以看看,代码如下: 阅读全文
posted @ 2019-06-18 09:39 大道至简,小而蕴真 阅读(1748) 评论(0) 推荐(0) 编辑
摘要:OCR OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。对于图形验证码来说,它们都是一些不规则的字符,这些字符确实是由字符稍加扭曲变换得到的内容。 例如,对于验证码,我们可以使用OCR技术来将其转化为电子文 阅读全文
posted @ 2019-06-17 11:44 大道至简,小而蕴真 阅读(3926) 评论(0) 推荐(0) 编辑
摘要:大家好我叫hardy 需求:爬取某个页面,并把该页面的图片下载到本地 思考: img标签一个有多少种类型的src值?四种:1、以http开头的网络链接。2、以“//”开头网络地址。3、以“/”开头绝对路径。4、以“./”开头相对路径。当然还有其他类型,不过这个不做考虑,能力有限呀。 使用什么工具?我 阅读全文
posted @ 2019-06-12 14:54 大道至简,小而蕴真 阅读(12931) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示