摘要:
HTTP 协议是建立在 TCP/IP 协议之上的应用层规范,它把 HTTP 请求分为三个部分:请求行、请求头、消息主体。协议规定 POST 提交的数据必须放在消息主体(entity-body)中,但协议并没有规定数据使用什么编码方式。 服务端通常是根据请求头(headers)中的 Content-T 阅读全文
摘要:
对于限制了ip和来源的网站,使用正常的采集方式是不行的。这里说我的一种方法吧,使用php的curl类实现模拟ip和来源,可以实现采集限制ip和来源的网站。 1.设置页面限制ip和来源访问比如服务端的server.php 使用curl正常访问 使用curl模拟ip和来源进行访问 模拟来源 curl_s 阅读全文