摘要: 最近在学习Python,自然接触到了爬虫,写了一个小型爬虫软件,从初始Url解析网页,使用正则获取待爬取链接,使用beautifulsoup解析获取文本,使用自己写的输出器可以将文本输出保存,具体代码如下: Spider_main.py url_manager.py html_parser.py h 阅读全文
posted @ 2018-06-12 23:24 筱峰学长 阅读(4794) 评论(1) 推荐(1) 编辑