摘要: 我们都知道在爬取网页信息时很容易遭到网站的封禁,这时我们就要用到代理IP 以下是模拟浏览器访问网页的代码 在自定义函getHtml()中可以得到解析后的网页信息 _headers = { 'Accept':'text/html,application/xhtml+xml,application/xm 阅读全文
posted @ 2023-04-19 14:42 h云淡风轻 阅读(22) 评论(0) 推荐(0) 编辑