摘要: 背景 现在的登录系统几乎都是带验证手段的,至于验证的手段也是五花八门,当然用的最多的还是验证码。不过纯粹验证码识已经是很落后的东西了,现在比较多见的是滑动验证,滑动拼图验证(这个还能往里面加广告)、点击图片特定位置确认(同样能放广告),再或者谷歌的No-CAPTCHA。总之纯粹的验证码效果不好,成本 阅读全文
posted @ 2018-04-16 17:40 张老师的小黑屋 阅读(693) 评论(0) 推荐(0) 编辑
摘要: 下面是split截取获得 >>> str = 'http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a56f0b91.pdf'>>> print str.split()['http://manualfile.s3.amaz 阅读全文
posted @ 2018-04-16 14:50 张老师的小黑屋 阅读(12406) 评论(0) 推荐(0) 编辑
摘要: Cookie的使用 用 Python 来登录网站, 用Cookies记录登录信息, 然后就可以抓取登录之后才能看到的信息。 什么是cookies? Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)。比如说有些网站需要登录后才能访问某个页面, 阅读全文
posted @ 2018-04-16 14:24 张老师的小黑屋 阅读(307) 评论(0) 推荐(0) 编辑