摘要: 用到了requests、BeautifulSoup、urllib等,具体代码如下。 在编代码的时候,有一些小细节的处理不够熟练,比如文件的读写。下面再搞一搞。 爬虫爬取了前30个页面保存到本地文件中,其实可以考虑用多线程,线程池的方法去分别爬取每一个主页面,这样可能效率会更高一些。至于多线程的部分, 阅读全文
posted @ 2018-07-21 14:13 正态分个布 阅读(630) 评论(0) 推荐(0) 编辑