摘要: html.parser是一个非常简单和实用的库,它的核心是HTMLParser类。工作的流程是:当你feed给它一个类似HTML格式的字符串时,它会调用goahead方法向前迭代各个标签,并调用对应的parse_xxxx方法提取start_tag, tag, attrs data comment和end_tag等等标签信息和数据,然后调用对应的方法对这些抽取出来的内容进行处理。整个HTMLPars... 阅读全文
posted @ 2019-02-26 11:42 阳光宝贝-沐沐 阅读(945) 评论(0) 推荐(0) 编辑