cekong

补全爬取的url

有时爬取到的href不全，如href=‘/11031/’
解决方法：
from urllib import parse
url=parse.urljoin(response.url,get_url)
response.url  正在爬取的网页的url
get_url 网页中条目的url

posted on 2018-11-21 15:15 cekong 阅读(306) 评论(0) 收藏举报

刷新页面返回顶部