摘要: 学习了urllib,urlib2以及正则表达式之后就可以做一些简单的抓取以及处理工作。为了抓取方便,这里选择糗事百科的网页作为抓取对象。 1. 获取数据: 2. 抓取段子的文字内容: 我用的firefox浏览器,按F12,然后进入查看器,就可以对生成的页面代码进行查看,当点击某一项的时候会在网页中标 阅读全文
posted @ 2016-10-20 15:08 Amei1314 阅读(1726) 评论(0) 推荐(0) 编辑