返回顶部

随笔分类 -  网络爬虫

摘要:随身笔记 Python中__init__和self的意义和作用 init()方法,在创建一个对象时默认被调用,不需要手动调用 复制代码 #init方法 class Car(): def __init__(self): self.num = 4 self.color = '红色' def taxi(s 阅读全文
posted @ 2020-08-06 10:53 fen斗 阅读(499) 评论(0) 推荐(0) 编辑
摘要:爬虫请求头各参数含义 Host 指定的请求资源的域名 User-Agant 浏览器代理 Accept指定客户端可以接受哪些类型的信息 Cookie Cookie其实就是由服务器发给客户端的特殊信息,而这些信息以文本文件的方式存放在客户端,然后客户端每次向服务器发送请求的时候都会带上这些特殊的信息。 阅读全文
posted @ 2020-08-06 10:43 fen斗 阅读(3713) 评论(0) 推荐(0) 编辑
摘要:转(https://blog.csdn.net/weixin_43797908/article/details/84790896) 很多网站再申请访问的时候没有请求头访问会不成功,或者返回乱码,最简单的解决方式就是伪装成浏览器进行访问,这就需要添加一个请求头来伪装浏览器行为 ** Header ** 阅读全文
posted @ 2020-08-06 10:26 fen斗 阅读(1276) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://zhuanlan.zhihu.com/p/49731572 User-Agent 按照百度百科的解释:User-Agent中文名为用户代理,简称 UA,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、 阅读全文
posted @ 2020-08-06 10:07 fen斗 阅读(4808) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示