scrapy中的canonicalize_url【转】
摘要:
转自:http://www.leyle.com/archives/canonicalize_url.html思考一下:对url进行规范化处理是否是必须的?因为这一步处理涉及到编码转换,对于一个网页的新链发现来说是比较耗时的。为什么需要格式化 url?比如下面几个url:http://www.exam... 阅读全文
posted @ 2016-01-24 22:29
chybot
阅读(601)
评论(0)
推荐(0)