Python3 网络爬虫开发实战学习弱点书签

 

1. urllib.robotparse模块对robot.txt文件的解析,can_fetch()方法和parse()方法。  Page121

2. lxml.etree模块自动补全Html代码,Html()方法和parse()两种方法打开文件。  Page159  

posted @ 2018-06-28 12:43  StrivePy  阅读(144)  评论(0编辑  收藏  举报