爬虫小技巧

爬取这种类型的数据,它的特点就是不在标签中,我现在所掌握的xpath知识搞不定它啊。

想想用正则表达式也行,暂且不研究。这里用另一种方法。

首先附上我抓到的文本信息。

经过分析,这些信息都是成对出现的,那么清洗也就不难了。

简单的字符串处理即可。

OK.

 

posted @ 2017-11-07 15:05  深圳地铁Princess  阅读(168)  评论(0编辑  收藏  举报