摘要:
前面既然都提到编码了,那么把相关的编码问题补充完整吧
编码
之前我说过,使用python2爬取网页时,容易出现编码问题,下面就真的拿个例子来看看:
python2下: 阅读全文
摘要:
其实在最前面的某一篇博文里,是绝对提过编码的,有ASCII,有UTF-8,有GB2312等等,这些我绝对说过的。
url编码
首先,Http协议中参数的传输是"key=value"这种键值对形式的,如果要传多个参数就需要用“&”符号对键值对进行分割。如"?key1=value1&key2=value2",这样在服务端在收到这种字符串的时候,会用“&”分割出每一个参数,然后再用“=”来分割出键和值并进行处理。
然后,url只能使用 ASCII 字符集来通过因特网进行发送,也就是说url允许的只能是英文字母、阿拉伯数字和某些标点符 阅读全文