2018年7月15日

结缘爬虫-(一)

摘要: 某个项目中,需要爬虫去获取某个航空公司网站的数据,为了偷懒,我选择了 seleinum来模拟浏览器操作来直接获取有需要数据的网页。 使用一开始,我分别下载好了geckodriver(火狐)和chromedriver(谷歌)两个浏览器驱动, 但使用时chromedriver成功打开了火狐浏览器,而ge 阅读全文

posted @ 2018-07-15 22:00 悄然而来 阅读(95) 评论(0) 推荐(0) 编辑

结缘爬虫-序

摘要: 爬虫,形象上来说,它就是行走于网络上的网络机器人;具体来讲,它就是通过网络对网络资源进行定时、定量或者定速采集的程序,网络资源可以是文本、图像和音频。 爬虫的基本原理其实非常简单,就是发送请求报文,处理反爬机制,然后获取响应报文。 阅读全文

posted @ 2018-07-15 20:34 悄然而来 阅读(93) 评论(0) 推荐(0) 编辑

导航