2014 年 4月 29 日随笔档案 - prisoner

2014年4月29日

摘要：代码是这样1 htmlSource=''2 charset = re.findall('',htmlSource)开始想把'gbk'匹配出来，由于HTML文件的meta标签各个网站的不一样，于是只能按照上面的写法，先匹配出‘“gbk’，再把"去掉，可是这么天真的正则表达式却匹配错误了，因为从地一个"... 阅读全文

posted @ 2014-04-29 17:22 prisoner 阅读(390) 评论(0) 推荐(0) 编辑

prisoner

公告