摘要: 因为爬虫开发用的mongodb数据库较多,所以就在我的ubuntu16.04上安装 经过sudo apt-get install mongodb后完成初步安装,接下来我配置好mongod.conf文件,并且也删除了mongodb.lock文件,然后再进行上述操作。 接下来我就通过sudo servi 阅读全文
posted @ 2019-10-12 11:54 两毛钱的月色 阅读(9220) 评论(0) 推荐(0) 编辑
摘要: 今天在抓取一个网站,我想抓取所有的tr,xpath配置完全正确,但是就是抓取不到数据 他的html结构是这样的,后来我就去问度娘,看到别人的解决方案是将tbody删除,因为这个是浏览器会对html文本进行一定的规范化 最后可以正确的抓取到了我想要的数据。 如果不能解决还望指正我的错处。 阅读全文
posted @ 2019-10-12 11:13 两毛钱的月色 阅读(285) 评论(0) 推荐(0) 编辑