HTTP的请求与响应

http请求

浏览器中输入url后,浏览器向网站所在服务器发送了一个请求,网站服务器接收请求,并对这个请求进行处理和解析,然后返回对应的响应,传回给浏览器,再通过浏览器解析出来

请求可分为四部分内容:

  • 请求的url(request url)
  • 请求方法(request method)
  • 请求头(request headers)
  • 请求体(request body)

请求方法分类:

  • get请求:

    • 请求中的参数包含在url里面

    • 请求提交的数据最多只有1024字节

  • post请求:

    • 表单提交时候发起,如用户登录

    • 数据以表单的形式传输,不会体现在url中

    • 请求提交的数据没有大小限制

    • 数据传输更安全(参数不会体现在url中)

请求头:

用来说明服务器要使用的附加信息,比较重要的信息有cookie,user-agent(请求载体的身份标识),Connection(请求完毕后,是断开连接还是保持连接)

请求体:

一般承载的内容是post请求中的表单数据,对于get请求,请求体为空

http响应

响应由服务器返回给客户端,可分为三部分:

  • 响应状态码 ( response status code )
  • 响应头 ( response headers)
  • 响应体(response body)

响应状态码:

表示服务器的响应状态,200代表服务器正常响应,404代表页面未找到,500代表服务器内部发生错误;可以根据状态码来判断服务器的响应状态,常见的错误代码及错误原因:

响应头:

包含了服务器对请求的应答信息,如content_type(服务器响应回客户端的数据类型),server,set-cookis等

响应体:

爬虫请求后解析的内容就是响应体,响应的正文数据,比如请求网页时,响应体是html代码;请求一张图片时, 响应体为图片的二进制数据; json数据等

posted @ 2022-11-07 16:16  做好学习笔记  阅读(84)  评论(0编辑  收藏  举报