摘要: 代码是这样1 htmlSource=''2 charset = re.findall('',htmlSource)开始想把'gbk'匹配出来,由于HTML文件的meta标签各个网站的不一样,于是只能按照上面的写法,先匹配出‘“gbk’,再把"去掉,可是这么天真的正则表达式却匹配错误了,因为从地一个"... 阅读全文
posted @ 2014-04-29 17:22 prisoner 阅读(390) 评论(0) 推荐(0) 编辑