摘要: urllib与urllib2:urllib2可以接受一个Request类的实例来设置URL请求的headers,urllib仅可以接受URL。这意味着,你不可以伪装你的User Agent字符串等。urllib提供urlencode方法用来GET查询字符串的产生,而urllib2没有。转载自 htt... 阅读全文
posted @ 2014-08-24 16:04 fkissx 阅读(361) 评论(0) 推荐(0) 编辑
摘要: python re模块中的用法:1,compile: re.compile(strPattern[, flag])pattern=re.compile(r"(.*?)")得到的是一个pattern对象,属性有:pattern: 编译时用的表达式字符串。flags: 编译时用的匹配模式。数字形式。gr... 阅读全文
posted @ 2014-08-24 15:32 fkissx 阅读(3328) 评论(0) 推荐(0) 编辑
摘要: 非贪婪模式:*?尽可能少匹配 如(.*?) +?至少匹配前面的形式一次原生字符串: r"\d"匹配一个数字,一般都要加r,解决转义反斜杠的问题否则要这样写"\\d"正则表达式修饰符 - 可选标志re.I:使匹配对大小写不敏感re.L:做本地化识别(locale-aware)匹配re.M:多行匹配,影... 阅读全文
posted @ 2014-08-24 15:27 fkissx 阅读(164) 评论(0) 推荐(0) 编辑