2015年1月30日

【转】Python获取网页是显示字体为乱码

摘要: 原文链接在Python2.7中从网页获取的字符均是以按网页中的编码方式进行编码保存的,并不关心你实际上使用的是什么方式的编码。(给啥要啥,不管能不能吸收,真够贪心的。)------以下为转载内容--------解决方法:1.知道系统所使用的编码格式2.把获取的页面先用系统格式解码,然后在编码为utf... 阅读全文

posted @ 2015-01-30 11:02 joker_02 阅读(198) 评论(0) 推荐(0) 编辑

Python学习笔记[6]--SGMLParser

摘要: -----待解决问题-----1、重写__init__和reset()函数时,会报错。----大概与不知如何实现有关2、同一标签下,多个相同标签只提取特定内容-不知如何做。solution:如果排列有规律的表格中,可以增加一个变量定位相关标签------正文--------SGMLPaser是Pyt... 阅读全文

posted @ 2015-01-30 10:58 joker_02 阅读(911) 评论(0) 推荐(0) 编辑

导航