python编码问题

用Python requests获取网页数据时发现一个问题返回的数据text部分可能会是乱码

t = requests.post(url, data=params, headers=header)
print(t.text)

<li >ç¨æ·åä¸ºä¸å¡éå·ï¼å¯ç ä¸ºèº«ä»½è¯å·ç ååä½ï¼èº«ä»½è¯å6ä½å¸¦æXçXä¸ºå¤§åã(ä¸ªå«æå¸èº«ä»½è¯å·ç ä¸º15ä½)</li>
           <li style="list-style-type: none;"><br/></li>
           <li >å¯ç å¨è¿å¥ç³»ç»åå¯ç±è¯»èéæ°è®¾ç½®</li>
           <li style="list-style-type: none;"><br/></li>
           <li>éäºéè§è¯»èåéç¨è¯è¯»èç¨æ·åååå§å¯ç ä»ä¸ºè¯ä»¶å·</li>
           <li style="list-style-type: none;"><br/></li>
           <li>Emailç±æ¨èªè¡è®¾å®ï¼ç»éåå¯ä»¥ä¿®æ¹</li>
           <li style="list-style-type: none;"><br/></li>
           <li>å¯ç ååéè¦æ¨é¦åéªè¯æ¨çEmail</li>

看来是解码问题，去官方文档看一下
找了半天，发现这个

大意就是说返回内容根据http头里面的内容编码，如果头里面没有指定的话就可能出现编码错误
所以只要先前指定就可以了

t = requests.post(url, data=params, headers=head)
t.encoding = "Unicode"
print(t.text)

<li >用户名为一卡通号，密码为身份证号码后六位，身份证后6位带有X的X为大写。(个别教师身份证号码为15位)</li>
           <li style="list-style-type: none;"><br/></li>
           <li >密码在进入系统后可由读者重新设置</li>
           <li style="list-style-type: none;"><br/></li>
           <li>限于阅览读者和通用证读者用户名和初始密码仍为证件号</li>
           <li style="list-style-type: none;"><br/></li>
           <li>Email由您自行设定，登陆后可以修改</li>
           <li style="list-style-type: none;"><br/></li>
           <li>密码取回需要您首先验证您的Email</li>

问题解决

posted @ 2016-05-07 10:47 匣中失乐阅读(1004) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

匣中失乐

python编码问题

公告