有时爬取到的href不全,如href=‘/11031/’解决方法:from urllib import parseurl=parse.urljoin(response.url,get_url)response.url 正在爬取的网页的urlget_url 网页中条目的url
posted on 2018-11-21 15:15 cekong 阅读(288) 评论(0) 编辑 收藏 举报
Powered by: 博客园 Copyright © 2024 cekong Powered by .NET 8.0 on Kubernetes