摘要: python系列均基于python3.4环境 基本概念 html.parser的核心是HTMLParser类。工作的流程是:当你feed给它一个类似HTML格式的字符串时,它会调用goahead方法向前迭代各个标签,并调用对应的parse_xxxx方法提取start_tag,tag,data,com 阅读全文
posted @ 2016-03-31 12:54 lmei 阅读(11175) 评论(0) 推荐(1) 编辑