curl和jq的用法
一、curl
curl 是常用的命令行工具,用来请求 Web 服务器。它的名字就是客户端(client)的 URL 工具的意思。
它的功能非常强大,命令行参数多达几十种。如果熟练的话,完全可以取代 Postman 这一类的图形界面工具。
1、curl可以看作命令行浏览器,不带有任何参数时,curl 就是发出 GET 请求,查看网页源代码
1 | curl https: //www.example.com |
2、开启gzip请求
1 | curl -I http: //www.sina.com.cn/ -H Accept-Encoding:gzip,defalte |
3、监控网页的响应时间
1 2 3 4 | $ curl -o /dev/null -s -w "time_connect: %{time_connect}\ntime_starttransfer: %{time_starttransfer}\ntime_total: %{time_total}\n" "http://www.sina.com" time_connect: 0.039432 time_starttransfer: 0.045964 time_total: 0.051393 |
4、 监控站点可用性
1 2 | $ curl -o /dev/null -s -w %{http_code} "http://www.sina.com" 200% |
上面命令向www.example.com发出 GET 请求,服务器返回的内容会在命令行输出。
-A
-A参数指定客户端的用户代理标头,即User-Agent。curl 的默认用户代理字符串是curl/[version]。
1 | curl -A 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36' https: //google.com |
上面命令将User-Agent改成 Chrome 浏览器。
也可以通过-H参数直接指定标头,更改User-Agent。
1 | curl -H 'User-Agent: php/1.0' https: //google.com |
-b
-b参数用来向服务器发送 Cookie
1 | curl -b 'foo=bar' https: //google.com |
上面命令会生成一个标头Cookie: foo=bar,向服务器发送一个名为foo、值为bar的 Cookie。
1 | $ curl -b 'foo1=bar;foo2=bar2' https: //google.com |
上面命令发送两个 Cookie。
1 | $ curl -b cookies.txt https: //www.google.com |
上面命令读取本地文件cookies.txt,里面是服务器设置的 Cookie(参见-c参数),将其发送到服务器。
-c
-c参数将服务器设置的 Cookie 写入一个文件。
1 | $ curl -c cookies.txt https: //www.google.com |
上面命令将服务器的 HTTP 回应所设置 Cookie 写入文本文件cookies.txt。
-d
-d参数用于发送 POST 请求的数据体。
1 2 3 | $ curl -d 'login=emma&password=123' -X POST https: //google.com/login # 或者 $ curl -d 'login=emma' -d 'password=123' -X POST https: //google.com/login |
使用-d参数以后,HTTP 请求会自动加上标头Content-Type : application/x-www-form-urlencoded。并且会自动将请求转为 POST 方法,因此可以省略-X POST。
-d参数可以读取本地文本文件的数据,向服务器发送。
1 | curl -d '@data.txt' https: //google.com/login |
上面命令读取data.txt文件的内容,作为数据体向服务器发送。
--data-urlencode
--data-urlencode参数等同于-d,发送 POST 请求的数据体,区别在于会自动将发送的数据进行 URL 编码。
1 | $ curl --data-urlencode 'comment=hello world' https: //google.com/login |
上面代码中,发送的数据hello world之间有一个空格,需要进行 URL 编码。
-e
-e参数用来设置 HTTP 的标头Referer,表示请求的来源。
1 | $ curl -e 'https://google.com?q=example' https://www.example.com |
上面命令将Referer标头设为https://google.com?q=example。
-H参数可以通过直接添加标头Referer,达到同样效果。
1 | curl -H 'Referer: https://google.com?q=example' https://www.example.com |
-F
-F参数用来向服务器上传二进制文件
1 | $ curl -F 'file=@photo.png' https: //google.com/profile |
上面命令会给 HTTP 请求加上标头Content-Type: multipart/form-data,然后将文件photo.png作为file字段上传。
-F参数可以指定 MIME 类型。
1 | $ curl -F 'file=@photo.png;type=image/png' https: //google.com/profile |
上面命令指定 MIME 类型为image/png,否则 curl 会把 MIME 类型设为application/octet-stream。
-F参数也可以指定文件名。
1 | $ curl -F 'file=@photo.png;filename=me.png' https: //google.com/profile |
上面命令中,原始文件名为photo.png,但是服务器接收到的文件名为me.png。
-G
-G参数用来构造 URL 的查询字符串。
1 | $ curl -G -d 'q=kitties' -d 'count=20' https: //google.com/search |
上面命令会发出一个 GET 请求,实际请求的 URL 为https://google.com/search?q=kitties&count=20。如果省略--G,会发出一个 POST 请求。
如果数据需要 URL 编码,可以结合--data--urlencode参数。
1 | $ curl -G --data-urlencode 'comment=hello world' https: //www.example.com |
-H
-H参数添加 HTTP 请求的标头。
1 | $ curl -H 'Accept-Language: en-US' https: //google.com |
上面命令添加 HTTP 标头Accept-Language: en-US。
1 | $ curl -H 'Accept-Language: en-US' -H 'Secret-Message: xyzzy' https: //google.com |
上面命令添加两个 HTTP 标头。
1 | $ curl -d '{"login": "emma", "pass": "123"}' -H 'Content-Type: application/json' https: //google.com/login |
上面命令添加 HTTP 请求的标头是Content-Type: application/json,然后用-d参数发送 JSON 数据。
-i
-i参数打印出服务器回应的 HTTP 标头,查询web服务器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | curl -i www.sina.com HTTP/1.1 200 OK <strong>Server: nginx</strong> Date: Fri, 19 Feb 2021 01:56:19 GMT Content-Type: text/html Content-Length: 22981 Connection: keep-alive Vary: Accept-Encoding ETag: W/ "5fed8659-831" V=5965C31 X-Powered-By: shci_v1.13 Expires: Fri, 19 Feb 2021 01:58:04 GMT Cache-Control: max-age=120 X-Via-SSL: ssl.97.sinag1.bx.lb.sinanode.com Edge-Copy-Time: 1613699764777 Age: 15 Via: https/1.1 cnc.yizhuang. union .95 (ApacheTrafficServer/6.2.1 [cRs f ]) X-Cache: HIT.unknown X-Via-CDN: f=edge,s=cnc.yizhuang. union .94.nb.sinaedge.com,c=125.33.25.114;f=Edge,s=cnc.yizhuang. union .95,c=172.16.56.94 X-Via-Edge: 16136997797397219217d5e3810ac0a403fb9 |
上面命令收到服务器回应后,先输出服务器回应的标头,然后空一行,再输出网页的源码。
-I
-I参数向服务器发出 HEAD 请求,然会将服务器返回的 HTTP 标头打印出来。
1 | $ curl -I https: //www.example.com |
上面命令输出服务器对 HEAD 请求的回应。
--head参数等同于-I。
1 | $ curl --head https: //www.example.com |
-k
-k参数指定跳过 SSL 检测。
1 | $ curl -k https: //www.example.com |
上面命令不会检查服务器的 SSL 证书是否正确。
-L
-L参数会让 HTTP 请求跟随服务器的重定向。curl 默认不跟随重定向。常与-s连用
1 2 3 | $ curl -s -L -d 'tweet=hi' https: //api.twitter.com/tweet $ curl -L https: //github.com/docker/compose/releases/download/1.25.0-rc4/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose |
--limit-rate
--limit-rate用来限制 HTTP 请求和回应的带宽,模拟慢网速的环境。
1 | $ curl --limit-rate 200k https: //google.com |
上面命令将带宽限制在每秒 200K 字节。
-o
-o参数将服务器的源代码保存成文件,等同于wget命令
1 | $ curl -o 文件名 https: //www.example.com |
上面命令将www.example.com保存成example.html。
-O
-O参数将服务器回应保存成文件,并将 URL 的最后部分当作文件名。
1 | $ curl -O https: //www.example.com/foo/bar.html |
上面命令将服务器回应保存成文件,文件名为bar.html。
下载多个文件,如screen1-screen10
1 | curl -O http: //cgi2.tky.3web.ne.jp/~zzh/screen[1-10].JPG |
-s
-s参数将不输出错误和进度信息。
1 | curl -s https: //www.example.com |
上面命令一旦发生错误,不会显示错误信息。不发生错误的话,会正常显示运行结果。
如果想让 curl 不产生任何输出,可以使用下面的命令。
1 | $ cur<br>l -s -o /dev/null https: //google.com |
-S
-S参数指定只输出错误信息,通常与-s一起使用。
1 | $ curl -S -s -o /dev/null https: //google.com |
上面命令没有任何输出,除非发生错误。
-u
-u参数用来设置服务器认证的用户名和密码
1 | $ curl -u 'bob:12345' https: //google.com/login |
上面命令能够识别 URL 里面的用户名和密码,将其转为上个例子里面的 HTTP 标头。
1 | curl -u 'bob' https: //google.com/login |
上面命令只设置了用户名,执行后,curl 会提示用户输入密码。
-v
-v参数可以显示一次 http 通信的整个过程,包括端口连接和 http request 头信息。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | curl -v www.sina.com * Trying 123.125.104.150... * TCP_NODELAY set * Connected to www.sina.com (123.125.104.150) port 80 (#0) > GET / HTTP/1.1 > Host: www.sina.com > User-Agent: curl/7.64.1 > Accept: */* > < HTTP/1.1 200 OK < Server: nginx < Date: Fri, 19 Feb 2021 02:02:06 GMT < Content-Type: text/html < Content-Length: 22981 < Connection: keep-alive |
--trace参数也可以用于调试,还会输出原始的二进制数据。
1 2 | $ curl --trace - https: //www.example.com $ curl --trace-ascii output.txt www.sina.com |
-x
-x参数指定 HTTP 请求的代理。
1 | $ curl -x socks5: //james:cats@myproxy.com:8080 https://www.example.com |
上面命令指定 HTTP 请求通过myproxy.com:8080的 socks5 代理发出。
如果没有指定代理协议,默认为 HTTP。
1 | $ curl -x james:cats@myproxy.com:8080 https: //www.example.com |
上面命令中,请求的代理使用 HTTP 协议。
-X
-X参数指定 HTTP 请求的方法。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | $ curl -X POST https: //www.example.com $ curl -X GET -s http: //127.0.0.1:2376/volumes | jq . { "Volumes" : [ { "CreatedAt" : "2020-12-15T19:49:52+08:00" , "Driver" : "local" , "Labels" : {}, "Mountpoint" : "/mnt/data/docker-data/volumes/pre_install_nvidia-docker/_data" , "Name" : "pre_install_nvidia-docker" , "Options" : {}, "Scope" : "local" } ], "Warnings" : null } |
其中jq “.”
最简单的jq程序是表达式".",它不改变输入,但可以将其优美地输出,便于阅读和理解。
二、jq
(python -m json.tool也能达到一样的效果)
jq是一个轻量级的命令行工具,让你可以非常方便地处理JSON数据,如切分、过滤、映射、转化等,就像sed、awk、grep文本处理三剑客一样。jq是用C写的,没有运行时依赖,你可以直接下载可执行文件就可以使用了。
1、安装
Download jq (stedolan.github.io)
1 | yum install jq |
2、过滤:获取全部内容
1 2 3 4 | echo '{"name":"Larry Deng"}' | jq . { "name" : "Larry Deng" } |
3、过滤:获取特定key值
1 2 | echo '{"name":"Larry Deng"}' | jq .name "Larry Deng" |
4、计算长度
1 2 | echo '{"name":"Larry Deng","age":18}' | jq '.name | length' 10 |
5、数学计算(求立方),前一个数字是后一个数字的立方根
1 2 3 4 5 6 7 | echo '[1,2,3,4]' | jq 'map(.*.*.)' [ 1, 8, 27, 64 ] |
6、截取数组部分(使用管道),0:4表示从0开始取4个数
1 2 3 4 5 6 7 | echo '[1,2,3,6,8]' | jq '.[0:4]' [ 1, 2, 3, 6 ] |
7、读取所有的key、values
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | # 列表套引号 echo '{"abc": 1, "abcd": 2, "Foo": 3}' | jq keys [ "Foo" , "abc" , "abcd" ] # 字符串输出 echo '{"common":"true","dataflow_task":"true","dp":"true","kafka":"true","lead-manager":"true","logstash":"true","opt":"true","portainer":"true"}' | jq -c . | jq -r 'keys[]' common dataflow_task dp kafka lead-manager logstash opt portainer # 获取values echo '{"common":"true","dataflow_task":"true","dp":"true","kafka":"true","lead-manager":"true","logstash":"true","opt":"true","portainer":"true"}' | jq -c . | jq -r 'values[]' |
8、处理文本
除了可以通过管道来处理文本,也可以直接处理文件。把下面内容保存为jq.json
1 2 3 4 5 6 7 8 | { "info" : [ { "name" : "Larry Deng" , "age" : "18" , "webSite" : "www.pkslow.com" }, { "name" : "Larry" , "age" : "01" , "webSite" : "pkslow.com" }, { "name" : "LarryDpk" , "age" : "20" , "webSite" : "https://www.pkslow.com" } ], "version" : "1.0.3" } |
处理如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | $ jq .version jq.json "1.0.3" $ jq .info[0] jq.json { "name" : "Larry Deng" , "age" : "18" , "webSite" : "www.pkslow.com" } $ jq '.info |.[].name ' jq.json "Larry Deng" "Larry" "LarryDpk" $ jq '.info |.[].webSite ' jq.json "www.pkslow.com" "pkslow.com" "https://www.pkslow.com" |
9、紧凑输出 jq -c:
-c 选项表示输出紧凑格式的 JSON,去掉了换行和多余的空格,使输出更紧凑。这对于需要将 JSON 作为字符串传递给其他命令(例如在变量中使用时)很有用,因为它可以避免额外的换行符和空格干扰。
jq Manual (development version) (stedolan.github.io) jq官网示例