linux curl是通过url语法在命令行下上传或下载文件的工具软件,它支持http,https,ftp,ftps,telnet等多种协议,常被用来抓取网页和监控Web服务器状态。

一、Linux curl用法举例:
1. linux curl抓取网页:

抓取百度:

 

 

如发现乱码,可以使用iconv转码:

 

iconv的用法请参阅:在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题

 

2. Linux curl使用代理

linux curl使用http代理抓取页面:

 

使用socks代理抓取页面:

 

代理服务器地址可以从爬虫代理上获取。

 

3. linux curl处理cookies

接收cookies:

 

发送cookies:

 

 

4. linux curl发送数据:

linux curl get方式提交数据:

 

linux curl post方式提交数据:

 

以表单的方式上传文件:

 

相当于设置form表单的method="POST"和enctype='multipart/form-data'两个属性。

 

5. linux curl http header处理:

设置http请求头信息:

设置http响应头处理:

 

 

6. linux curl认证:

 

 

 

6. 其他:

 

 

 
 原文地址:http://www.aiezu.com/system/linux/linux_curl_syntax.html
 
linux 使用curl小经验教训:
http请求地址的url要使用""括起来。当有存在多个参数使用&连接时可能会出错。
curl -v "http://localhost:8080/xxxxxx/alive.jsp" 返回完整的报文:
* About to connect() to localhost port 8080 (#0)
*   Trying 127.0.0.1... connected
* Connected to localhost (127.0.0.1) port 8080 (#0)
> GET /ppcredit_getbill/alive.jsp HTTP/1.1
> User-Agent: curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.19.1 Basic ECC zlib/1.2.3 libidn/1.18 libssh2/1.4.2
> Host: localhost:8080
> Accept: */*
> 
< HTTP/1.1 200 OK
< Server: Apache-Coyote/1.1
< Set-Cookie: JSESSIONID=11FB3734B3043E6C2E4B287C39C82350; Path=/ppcredit_getbill/; HttpOnly
< Content-Type: text/html;charset=UTF-8
< Content-Length: 236
< Date: Thu, 31 Aug 2017 11:02:38 GMT
< 

<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>tomcat娴嬭瘯椤/title>
</head>
<body >
                <h1>tomcat is alive锛/h1>
                <hr>
                <table>
                        <tr>
                                <td>璁块棶IP</td>
                                <td>127.0.0.1</td>
                        </tr>
                </table>
</body>
* Connection #0 to host localhost left intact
* Closing connection #0

 

 
 
 
 
 
posted on 2015-02-02 09:44  一天不进步,就是退步  阅读(94676)  评论(0编辑  收藏  举报