摘要: 自学python网络爬虫,发现request比urllib还是要好用一些,因此利用request和BeautifulSoup来实现糗百的首页笑话的抓取。BeautifulSoup通过find和findAll以及利用正则表达式实现HTML对应模块的抓取,当然select也是一个不错的选择。下面是临时的 阅读全文
posted @ 2016-10-28 20:49 我是毛毛虫 阅读(547) 评论(0) 推荐(0) 编辑