摘要: 本文以有道翻译为例作为讲解,使用的 python 3.5.2 版本 ,涉及到反爬虫手段有 sign签名、时间戳,逆向解析 js 来确定签名算法。 研究有道词典的反爬虫机制 1、打开有道词典 http://fanyi.youdao.com/,按下F12,输入要翻译的内容进行翻译,观察network。 阅读全文
posted @ 2018-03-08 22:14 张老师的小黑屋 阅读(409) 评论(0) 推荐(0) 编辑
摘要: import sys ''' *字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码, 即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符... 阅读全文
posted @ 2018-03-08 17:19 张老师的小黑屋 阅读(3869) 评论(0) 推荐(0) 编辑
摘要: url中带_o时,会提示{"errorCode":50}。 从其他地方发现删除后可以正常运行,不知道原因。有知道的可以留个言。 阅读全文
posted @ 2018-03-08 16:01 张老师的小黑屋 阅读(6763) 评论(3) 推荐(0) 编辑