curl和jq的用法
一、curl
curl 是常用的命令行工具,用来请求 Web 服务器。它的名字就是客户端(client)的 URL 工具的意思。
它的功能非常强大,命令行参数多达几十种。如果熟练的话,完全可以取代 Postman 这一类的图形界面工具。
1、curl可以看作命令行浏览器,不带有任何参数时,curl 就是发出 GET 请求,查看网页源代码
curl https://www.example.com
2、开启gzip请求
curl -I http://www.sina.com.cn/ -H Accept-Encoding:gzip,defalte
3、监控网页的响应时间
$ curl -o /dev/null -s -w "time_connect: %{time_connect}\ntime_starttransfer: %{time_starttransfer}\ntime_total: %{time_total}\n" "http://www.sina.com" time_connect: 0.039432 time_starttransfer: 0.045964 time_total: 0.051393
4、 监控站点可用性
$ curl -o /dev/null -s -w %{http_code} "http://www.sina.com" 200%
上面命令向www.example.com发出 GET 请求,服务器返回的内容会在命令行输出。
-A
-A参数指定客户端的用户代理标头,即User-Agent。curl 的默认用户代理字符串是curl/[version]。
curl -A 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36' https://google.com
上面命令将User-Agent改成 Chrome 浏览器。
也可以通过-H参数直接指定标头,更改User-Agent。
curl -H 'User-Agent: php/1.0' https://google.com
-b
-b参数用来向服务器发送 Cookie
curl -b 'foo=bar' https://google.com
上面命令会生成一个标头Cookie: foo=bar,向服务器发送一个名为foo、值为bar的 Cookie。
$ curl -b 'foo1=bar;foo2=bar2' https://google.com
上面命令发送两个 Cookie。
$ curl -b cookies.txt https://www.google.com
上面命令读取本地文件cookies.txt,里面是服务器设置的 Cookie(参见-c参数),将其发送到服务器。
-c
-c参数将服务器设置的 Cookie 写入一个文件。
$ curl -c cookies.txt https://www.google.com
上面命令将服务器的 HTTP 回应所设置 Cookie 写入文本文件cookies.txt。
-d
-d参数用于发送 POST 请求的数据体。
$ curl -d'login=emma&password=123'-X POST https://google.com/login # 或者 $ curl -d 'login=emma' -d 'password=123' -X POST https://google.com/login
使用-d参数以后,HTTP 请求会自动加上标头Content-Type : application/x-www-form-urlencoded。并且会自动将请求转为 POST 方法,因此可以省略-X POST。
-d参数可以读取本地文本文件的数据,向服务器发送。
curl -d '@data.txt' https://google.com/login
上面命令读取data.txt文件的内容,作为数据体向服务器发送。
--data-urlencode
--data-urlencode参数等同于-d,发送 POST 请求的数据体,区别在于会自动将发送的数据进行 URL 编码。
$ curl --data-urlencode 'comment=hello world' https://google.com/login
上面代码中,发送的数据hello world之间有一个空格,需要进行 URL 编码。
-e
-e参数用来设置 HTTP 的标头Referer,表示请求的来源。
$ curl -e 'https://google.com?q=example' https://www.example.com
上面命令将Referer标头设为https://google.com?q=example。
-H参数可以通过直接添加标头Referer,达到同样效果。
curl -H 'Referer: https://google.com?q=example' https://www.example.com
-F
-F参数用来向服务器上传二进制文件
$ curl -F 'file=@photo.png' https://google.com/profile
上面命令会给 HTTP 请求加上标头Content-Type: multipart/form-data,然后将文件photo.png作为file字段上传。
-F参数可以指定 MIME 类型。
$ curl -F 'file=@photo.png;type=image/png' https://google.com/profile
上面命令指定 MIME 类型为image/png,否则 curl 会把 MIME 类型设为application/octet-stream。
-F参数也可以指定文件名。
$ curl -F 'file=@photo.png;filename=me.png' https://google.com/profile
上面命令中,原始文件名为photo.png,但是服务器接收到的文件名为me.png。
-G
-G参数用来构造 URL 的查询字符串。
$ curl -G -d 'q=kitties' -d 'count=20' https://google.com/search
上面命令会发出一个 GET 请求,实际请求的 URL 为https://google.com/search?q=kitties&count=20。如果省略--G,会发出一个 POST 请求。
如果数据需要 URL 编码,可以结合--data--urlencode参数。
$ curl -G --data-urlencode 'comment=hello world' https://www.example.com
-H
-H参数添加 HTTP 请求的标头。
$ curl -H 'Accept-Language: en-US' https://google.com
上面命令添加 HTTP 标头Accept-Language: en-US。
$ curl -H 'Accept-Language: en-US' -H 'Secret-Message: xyzzy' https://google.com
上面命令添加两个 HTTP 标头。
$ curl -d '{"login": "emma", "pass": "123"}' -H 'Content-Type: application/json' https://google.com/login
上面命令添加 HTTP 请求的标头是Content-Type: application/json,然后用-d参数发送 JSON 数据。
-i
-i参数打印出服务器回应的 HTTP 标头,查询web服务器
curl -i www.sina.com HTTP/1.1 200 OK Server: nginx Date: Fri, 19 Feb 2021 01:56:19 GMT Content-Type: text/html Content-Length: 22981 Connection: keep-alive Vary: Accept-Encoding ETag: W/"5fed8659-831"V=5965C31 X-Powered-By: shci_v1.13 Expires: Fri, 19 Feb 2021 01:58:04 GMT Cache-Control: max-age=120 X-Via-SSL: ssl.97.sinag1.bx.lb.sinanode.com Edge-Copy-Time: 1613699764777 Age: 15 Via: https/1.1 cnc.yizhuang.union.95 (ApacheTrafficServer/6.2.1 [cRs f ]) X-Cache: HIT.unknown X-Via-CDN: f=edge,s=cnc.yizhuang.union.94.nb.sinaedge.com,c=125.33.25.114;f=Edge,s=cnc.yizhuang.union.95,c=172.16.56.94 X-Via-Edge: 16136997797397219217d5e3810ac0a403fb9
上面命令收到服务器回应后,先输出服务器回应的标头,然后空一行,再输出网页的源码。
-I
-I参数向服务器发出 HEAD 请求,然会将服务器返回的 HTTP 标头打印出来。
$ curl -I https://www.example.com
上面命令输出服务器对 HEAD 请求的回应。
--head参数等同于-I。
$ curl --head https://www.example.com
-k
-k参数指定跳过 SSL 检测。
$ curl -k https://www.example.com
上面命令不会检查服务器的 SSL 证书是否正确。
-L
-L参数会让 HTTP 请求跟随服务器的重定向。curl 默认不跟随重定向。常与-s连用
$ curl -s -L -d 'tweet=hi' https://api.twitter.com/tweet $ curl -L https://github.com/docker/compose/releases/download/1.25.0-rc4/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose
--limit-rate
--limit-rate用来限制 HTTP 请求和回应的带宽,模拟慢网速的环境。
$ curl --limit-rate 200k https://google.com
上面命令将带宽限制在每秒 200K 字节。
-o
-o参数将服务器的源代码保存成文件,等同于wget命令
$ curl -o 文件名 https://www.example.com
上面命令将www.example.com保存成example.html。
-O
-O参数将服务器回应保存成文件,并将 URL 的最后部分当作文件名。
$ curl -O https://www.example.com/foo/bar.html
上面命令将服务器回应保存成文件,文件名为bar.html。
下载多个文件,如screen1-screen10
curl -O http://cgi2.tky.3web.ne.jp/~zzh/screen[1-10].JPG
-s
-s参数将不输出错误和进度信息。
curl -s https://www.example.com
上面命令一旦发生错误,不会显示错误信息。不发生错误的话,会正常显示运行结果。
如果想让 curl 不产生任何输出,可以使用下面的命令。
$ cur
l -s -o /dev/null https://google.com
-S
-S参数指定只输出错误信息,通常与-s一起使用。
$ curl -S -s -o /dev/null https://google.com
上面命令没有任何输出,除非发生错误。
-u
-u参数用来设置服务器认证的用户名和密码
$ curl -u 'bob:12345' https://google.com/login
上面命令能够识别 URL 里面的用户名和密码,将其转为上个例子里面的 HTTP 标头。
curl -u 'bob' https://google.com/login
上面命令只设置了用户名,执行后,curl 会提示用户输入密码。
-v
-v参数可以显示一次 http 通信的整个过程,包括端口连接和 http request 头信息。
curl -v www.sina.com * Trying 123.125.104.150... * TCP_NODELAY set * Connected to www.sina.com (123.125.104.150) port 80 (#0) > GET / HTTP/1.1 > Host: www.sina.com > User-Agent: curl/7.64.1 > Accept: */* > < HTTP/1.1 200 OK < Server: nginx < Date: Fri, 19 Feb 2021 02:02:06 GMT < Content-Type: text/html < Content-Length: 22981 < Connection: keep-alive
--trace参数也可以用于调试,还会输出原始的二进制数据。
$ curl --trace - https://www.example.com $ curl --trace-ascii output.txt www.sina.com
-x
-x参数指定 HTTP 请求的代理。
$ curl -x socks5://james:cats@myproxy.com:8080 https://www.example.com
上面命令指定 HTTP 请求通过myproxy.com:8080的 socks5 代理发出。
如果没有指定代理协议,默认为 HTTP。
$ curl -x james:cats@myproxy.com:8080 https://www.example.com
上面命令中,请求的代理使用 HTTP 协议。
-X
-X参数指定 HTTP 请求的方法。
$ curl -X POST https://www.example.com $ curl -X GET -s http://127.0.0.1:2376/volumes | jq . { "Volumes": [ { "CreatedAt": "2020-12-15T19:49:52+08:00", "Driver": "local", "Labels": {}, "Mountpoint": "/mnt/data/docker-data/volumes/pre_install_nvidia-docker/_data", "Name": "pre_install_nvidia-docker", "Options": {}, "Scope": "local" } ], "Warnings": null }
其中jq “.”
最简单的jq程序是表达式".",它不改变输入,但可以将其优美地输出,便于阅读和理解。
二、jq
(python -m json.tool也能达到一样的效果)
jq是一个轻量级的命令行工具,让你可以非常方便地处理JSON数据,如切分、过滤、映射、转化等,就像sed、awk、grep文本处理三剑客一样。jq是用C写的,没有运行时依赖,你可以直接下载可执行文件就可以使用了。
1、安装
Download jq (stedolan.github.io)
yum install jq
2、过滤:获取全部内容
echo '{"name":"Larry Deng"}' | jq . { "name": "Larry Deng" }
3、过滤:获取特定key值
echo '{"name":"Larry Deng"}' | jq .name "Larry Deng"
4、计算长度
echo '{"name":"Larry Deng","age":18}' | jq '.name | length' 10
5、数学计算(求立方),前一个数字是后一个数字的立方根
echo '[1,2,3,4]' | jq 'map(.*.*.)' [ 1, 8, 27, 64 ]
6、截取数组部分(使用管道),0:4表示从0开始取4个数
echo '[1,2,3,6,8]' | jq '.[0:4]' [ 1, 2, 3, 6 ]
7、读取所有的key、values
# 列表套引号 echo '{"abc": 1, "abcd": 2, "Foo": 3}' | jq keys [ "Foo", "abc", "abcd" ] # 字符串输出 echo '{"common":"true","dataflow_task":"true","dp":"true","kafka":"true","lead-manager":"true","logstash":"true","opt":"true","portainer":"true"}' | jq -c . | jq -r 'keys[]' common dataflow_task dp kafka lead-manager logstash opt portainer # 获取values echo '{"common":"true","dataflow_task":"true","dp":"true","kafka":"true","lead-manager":"true","logstash":"true","opt":"true","portainer":"true"}' | jq -c . | jq -r 'values[]'
8、处理文本
除了可以通过管道来处理文本,也可以直接处理文件。把下面内容保存为jq.json
{ "info": [ {"name":"Larry Deng","age":"18","webSite":"www.pkslow.com"}, {"name":"Larry","age":"01","webSite":"pkslow.com"}, {"name":"LarryDpk","age":"20","webSite":"https://www.pkslow.com"} ], "version":"1.0.3" }
处理如下
$ jq .version jq.json "1.0.3" $ jq .info[0] jq.json { "name": "Larry Deng", "age": "18", "webSite": "www.pkslow.com" } $ jq '.info |.[].name ' jq.json "Larry Deng" "Larry" "LarryDpk" $ jq '.info |.[].webSite ' jq.json "www.pkslow.com" "pkslow.com" "https://www.pkslow.com"
9、紧凑输出 jq -c:
-c 选项表示输出紧凑格式的 JSON,去掉了换行和多余的空格,使输出更紧凑。这对于需要将 JSON 作为字符串传递给其他命令(例如在变量中使用时)很有用,因为它可以避免额外的换行符和空格干扰。
jq Manual (development version) (stedolan.github.io) jq官网示例