随笔分类 - 网络爬虫
摘要:随身笔记 Python中__init__和self的意义和作用 init()方法,在创建一个对象时默认被调用,不需要手动调用 复制代码 #init方法 class Car(): def __init__(self): self.num = 4 self.color = '红色' def taxi(s
阅读全文
摘要:爬虫请求头各参数含义 Host 指定的请求资源的域名 User-Agant 浏览器代理 Accept指定客户端可以接受哪些类型的信息 Cookie Cookie其实就是由服务器发给客户端的特殊信息,而这些信息以文本文件的方式存放在客户端,然后客户端每次向服务器发送请求的时候都会带上这些特殊的信息。
阅读全文
摘要:转(https://blog.csdn.net/weixin_43797908/article/details/84790896) 很多网站再申请访问的时候没有请求头访问会不成功,或者返回乱码,最简单的解决方式就是伪装成浏览器进行访问,这就需要添加一个请求头来伪装浏览器行为 ** Header **
阅读全文
摘要:原文链接:https://zhuanlan.zhihu.com/p/49731572 User-Agent 按照百度百科的解释:User-Agent中文名为用户代理,简称 UA,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、
阅读全文