2016 年 3月 31 日随笔档案 - lmei

2016年3月31日

python--爬虫入门（八）体验HTMLParser解析网页，网页抓取解析整合练习

摘要： python系列均基于python3.4环境基本概念 html.parser的核心是HTMLParser类。工作的流程是：当你feed给它一个类似HTML格式的字符串时，它会调用goahead方法向前迭代各个标签，并调用对应的parse_xxxx方法提取start_tag,tag,data,com 阅读全文

posted @ 2016-03-31 12:54 lmei 阅读(11175) 评论(0) 推荐(1) 编辑

公告