摘要: HTTP 协议是建立在 TCP/IP 协议之上的应用层规范,它把 HTTP 请求分为三个部分:请求行、请求头、消息主体。协议规定 POST 提交的数据必须放在消息主体(entity-body)中,但协议并没有规定数据使用什么编码方式。 服务端通常是根据请求头(headers)中的 Content-T 阅读全文
posted @ 2017-07-14 13:02 周伯通之草堂 阅读(1558) 评论(0) 推荐(1) 编辑
摘要: 对于限制了ip和来源的网站,使用正常的采集方式是不行的。这里说我的一种方法吧,使用php的curl类实现模拟ip和来源,可以实现采集限制ip和来源的网站。 1.设置页面限制ip和来源访问比如服务端的server.php 使用curl正常访问 使用curl模拟ip和来源进行访问 模拟来源 curl_s 阅读全文
posted @ 2017-07-14 11:06 周伯通之草堂 阅读(3119) 评论(0) 推荐(0) 编辑