2018 年 6月 12 日随笔档案 - 筱峰学长

2018年6月12日

摘要：最近在学习Python，自然接触到了爬虫，写了一个小型爬虫软件，从初始Url解析网页，使用正则获取待爬取链接，使用beautifulsoup解析获取文本，使用自己写的输出器可以将文本输出保存，具体代码如下： Spider_main.py url_manager.py html_parser.py h 阅读全文

posted @ 2018-06-12 23:24 筱峰学长阅读(4794) 评论(1) 推荐(1) 编辑

筱峰学长

公告