curl和jq的用法

一、curl

curl 是常用的命令行工具,用来请求 Web 服务器。它的名字就是客户端(client)的 URL 工具的意思。

它的功能非常强大,命令行参数多达几十种。如果熟练的话,完全可以取代 Postman 这一类的图形界面工具。

1、curl可以看作命令行浏览器,不带有任何参数时,curl 就是发出 GET 请求,查看网页源代码

curl https://www.example.com

2、开启gzip请求

curl -I http://www.sina.com.cn/ -H Accept-Encoding:gzip,defalte

3、监控网页的响应时间

$ curl -o /dev/null -s -w "time_connect: %{time_connect}\ntime_starttransfer: %{time_starttransfer}\ntime_total: %{time_total}\n" "http://www.sina.com"
time_connect: 0.039432
time_starttransfer: 0.045964
time_total: 0.051393

4、 监控站点可用性

$ curl -o /dev/null -s -w %{http_code} "http://www.sina.com"
200%

上面命令向www.example.com发出 GET 请求,服务器返回的内容会在命令行输出。

-A

-A参数指定客户端的用户代理标头,即User-Agent。curl 的默认用户代理字符串是curl/[version]。

curl -A 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36' https://google.com

上面命令将User-Agent改成 Chrome 浏览器。

也可以通过-H参数直接指定标头,更改User-Agent。

curl -H 'User-Agent: php/1.0' https://google.com

-b

-b参数用来向服务器发送 Cookie

curl -b 'foo=bar' https://google.com

上面命令会生成一个标头Cookie: foo=bar,向服务器发送一个名为foo、值为bar的 Cookie。

$ curl -b 'foo1=bar;foo2=bar2' https://google.com

上面命令发送两个 Cookie。

$ curl -b cookies.txt https://www.google.com

上面命令读取本地文件cookies.txt,里面是服务器设置的 Cookie(参见-c参数),将其发送到服务器。

-c

-c参数将服务器设置的 Cookie 写入一个文件。

$ curl -c cookies.txt https://www.google.com

上面命令将服务器的 HTTP 回应所设置 Cookie 写入文本文件cookies.txt。

-d

-d参数用于发送 POST 请求的数据体。

$ curl -d'login=emma&password=123'-X POST https://google.com/login
# 或者
$ curl -d 'login=emma' -d 'password=123' -X POST  https://google.com/login

使用-d参数以后,HTTP 请求会自动加上标头Content-Type : application/x-www-form-urlencoded。并且会自动将请求转为 POST 方法,因此可以省略-X POST。

-d参数可以读取本地文本文件的数据,向服务器发送。

curl -d '@data.txt' https://google.com/login

上面命令读取data.txt文件的内容,作为数据体向服务器发送。

--data-urlencode

--data-urlencode参数等同于-d,发送 POST 请求的数据体,区别在于会自动将发送的数据进行 URL 编码。

$ curl --data-urlencode 'comment=hello world' https://google.com/login

上面代码中,发送的数据hello world之间有一个空格,需要进行 URL 编码。

-e

-e参数用来设置 HTTP 的标头Referer,表示请求的来源。

$ curl -e 'https://google.com?q=example' https://www.example.com

上面命令将Referer标头设为https://google.com?q=example。

-H参数可以通过直接添加标头Referer,达到同样效果。

curl -H 'Referer: https://google.com?q=example' https://www.example.com

-F

-F参数用来向服务器上传二进制文件

$ curl -F 'file=@photo.png' https://google.com/profile

上面命令会给 HTTP 请求加上标头Content-Type: multipart/form-data,然后将文件photo.png作为file字段上传。

-F参数可以指定 MIME 类型。

$ curl -F 'file=@photo.png;type=image/png' https://google.com/profile

上面命令指定 MIME 类型为image/png,否则 curl 会把 MIME 类型设为application/octet-stream。

-F参数也可以指定文件名。

$ curl -F 'file=@photo.png;filename=me.png' https://google.com/profile

上面命令中,原始文件名为photo.png,但是服务器接收到的文件名为me.png。

-G

-G参数用来构造 URL 的查询字符串。

$ curl -G -d 'q=kitties' -d 'count=20' https://google.com/search

上面命令会发出一个 GET 请求,实际请求的 URL 为https://google.com/search?q=kitties&count=20。如果省略--G,会发出一个 POST 请求。

如果数据需要 URL 编码,可以结合--data--urlencode参数。

$ curl -G --data-urlencode 'comment=hello world' https://www.example.com

-H

-H参数添加 HTTP 请求的标头。

$ curl -H 'Accept-Language: en-US' https://google.com

上面命令添加 HTTP 标头Accept-Language: en-US。

$ curl -H 'Accept-Language: en-US' -H 'Secret-Message: xyzzy' https://google.com

上面命令添加两个 HTTP 标头。

$ curl -d '{"login": "emma", "pass": "123"}' -H 'Content-Type: application/json' https://google.com/login

上面命令添加 HTTP 请求的标头是Content-Type: application/json,然后用-d参数发送 JSON 数据。

-i

-i参数打印出服务器回应的 HTTP 标头,查询web服务器

curl -i www.sina.com
HTTP/1.1 200 OK
Server: nginx
Date: Fri, 19 Feb 2021 01:56:19 GMT
Content-Type: text/html
Content-Length: 22981
Connection: keep-alive
Vary: Accept-Encoding
ETag: W/"5fed8659-831"V=5965C31
X-Powered-By: shci_v1.13
Expires: Fri, 19 Feb 2021 01:58:04 GMT
Cache-Control: max-age=120
X-Via-SSL: ssl.97.sinag1.bx.lb.sinanode.com
Edge-Copy-Time: 1613699764777
Age: 15
Via: https/1.1 cnc.yizhuang.union.95 (ApacheTrafficServer/6.2.1 [cRs f ])
X-Cache: HIT.unknown
X-Via-CDN: f=edge,s=cnc.yizhuang.union.94.nb.sinaedge.com,c=125.33.25.114;f=Edge,s=cnc.yizhuang.union.95,c=172.16.56.94
X-Via-Edge: 16136997797397219217d5e3810ac0a403fb9

上面命令收到服务器回应后,先输出服务器回应的标头,然后空一行,再输出网页的源码。

-I

-I参数向服务器发出 HEAD 请求,然会将服务器返回的 HTTP 标头打印出来。

$ curl -I https://www.example.com

上面命令输出服务器对 HEAD 请求的回应。

--head参数等同于-I。

$ curl --head https://www.example.com

-k

-k参数指定跳过 SSL 检测。

$ curl -k https://www.example.com

上面命令不会检查服务器的 SSL 证书是否正确。

-L

-L参数会让 HTTP 请求跟随服务器的重定向。curl 默认不跟随重定向。常与-s连用

$ curl -s  -L -d 'tweet=hi' https://api.twitter.com/tweet

$ curl -L https://github.com/docker/compose/releases/download/1.25.0-rc4/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose

--limit-rate

--limit-rate用来限制 HTTP 请求和回应的带宽,模拟慢网速的环境。

$ curl --limit-rate 200k https://google.com

上面命令将带宽限制在每秒 200K 字节。

-o

-o参数将服务器的源代码保存成文件,等同于wget命令

$ curl -o  文件名  https://www.example.com

上面命令将www.example.com保存成example.html。

-O

-O参数将服务器回应保存成文件,并将 URL 的最后部分当作文件名。

$ curl -O https://www.example.com/foo/bar.html

上面命令将服务器回应保存成文件,文件名为bar.html。

下载多个文件,如screen1-screen10

curl -O http://cgi2.tky.3web.ne.jp/~zzh/screen[1-10].JPG 

-s

-s参数将不输出错误和进度信息。

curl -s https://www.example.com

上面命令一旦发生错误,不会显示错误信息。不发生错误的话,会正常显示运行结果。

如果想让 curl 不产生任何输出,可以使用下面的命令。

$ cur
l -s -o /dev/null https://google.com

-S

-S参数指定只输出错误信息,通常与-s一起使用。

$ curl -S -s -o /dev/null https://google.com

上面命令没有任何输出,除非发生错误。

-u

-u参数用来设置服务器认证的用户名和密码

$ curl -u 'bob:12345' https://google.com/login

上面命令能够识别 URL 里面的用户名和密码,将其转为上个例子里面的 HTTP 标头。

curl -u 'bob' https://google.com/login

上面命令只设置了用户名,执行后,curl 会提示用户输入密码。

-v

-v参数可以显示一次 http 通信的整个过程,包括端口连接和 http request 头信息。

 curl -v www.sina.com
*   Trying 123.125.104.150...
* TCP_NODELAY set
* Connected to www.sina.com (123.125.104.150) port 80 (#0)
> GET / HTTP/1.1
> Host: www.sina.com
> User-Agent: curl/7.64.1
> Accept: */*
>
< HTTP/1.1 200 OK
< Server: nginx
< Date: Fri, 19 Feb 2021 02:02:06 GMT
< Content-Type: text/html
< Content-Length: 22981
< Connection: keep-alive

--trace参数也可以用于调试,还会输出原始的二进制数据。

$ curl --trace - https://www.example.com
$ curl --trace-ascii output.txt www.sina.com

-x

-x参数指定 HTTP 请求的代理。

$ curl -x socks5://james:cats@myproxy.com:8080 https://www.example.com

上面命令指定 HTTP 请求通过myproxy.com:8080的 socks5 代理发出。

如果没有指定代理协议,默认为 HTTP。

$ curl -x james:cats@myproxy.com:8080 https://www.example.com

上面命令中,请求的代理使用 HTTP 协议。

-X

-X参数指定 HTTP 请求的方法。

$ curl -X POST https://www.example.com

$ curl -X GET -s http://127.0.0.1:2376/volumes | jq .
{
"Volumes": [
{
"CreatedAt": "2020-12-15T19:49:52+08:00",
"Driver": "local",
"Labels": {},
"Mountpoint": "/mnt/data/docker-data/volumes/pre_install_nvidia-docker/_data",
"Name": "pre_install_nvidia-docker",
"Options": {},
"Scope": "local"
}
],
"Warnings": null
}

其中jq “.”

最简单的jq程序是表达式".",它不改变输入,但可以将其优美地输出,便于阅读和理解。

二、jq

python -m json.tool也能达到一样的效果

jq是一个轻量级的命令行工具,让你可以非常方便地处理JSON数据,如切分、过滤、映射、转化等,就像sed、awk、grep文本处理三剑客一样。jq是用C写的,没有运行时依赖,你可以直接下载可执行文件就可以使用了。

1、安装

Download jq (stedolan.github.io)

yum install jq

2、过滤:获取全部内容

echo '{"name":"Larry Deng"}' | jq .
{
  "name": "Larry Deng"
}

3、过滤:获取特定key值

echo '{"name":"Larry Deng"}' | jq .name
"Larry Deng"

4、计算长度

 echo '{"name":"Larry Deng","age":18}' | jq '.name | length'
10

5、数学计算(求立方),前一个数字是后一个数字的立方根

echo '[1,2,3,4]' | jq 'map(.*.*.)'
[
  1,
  8,
  27,
  64
]

6、截取数组部分(使用管道),0:4表示从0开始取4个数

echo '[1,2,3,6,8]' | jq '.[0:4]'
[
  1,
  2,
  3,
  6
]

7、读取所有的key、values

# 列表套引号
echo '{"abc": 1, "abcd": 2, "Foo": 3}' | jq keys
[
  "Foo",
  "abc",
  "abcd"
]


# 字符串输出
echo '{"common":"true","dataflow_task":"true","dp":"true","kafka":"true","lead-manager":"true","logstash":"true","opt":"true","portainer":"true"}' | jq -c . | jq -r 'keys[]'
common
dataflow_task
dp
kafka
lead-manager
logstash
opt
portainer

# 获取values
echo '{"common":"true","dataflow_task":"true","dp":"true","kafka":"true","lead-manager":"true","logstash":"true","opt":"true","portainer":"true"}' | jq -c . | jq -r 'values[]'

8、处理文本

除了可以通过管道来处理文本,也可以直接处理文件。把下面内容保存为jq.json

{
  "info": [
    {"name":"Larry Deng","age":"18","webSite":"www.pkslow.com"},
    {"name":"Larry","age":"01","webSite":"pkslow.com"},
    {"name":"LarryDpk","age":"20","webSite":"https://www.pkslow.com"}
  ],
  "version":"1.0.3"
}

处理如下

$ jq .version jq.json 
"1.0.3"

$ jq .info[0] jq.json 
{
  "name": "Larry Deng",
  "age": "18",
  "webSite": "www.pkslow.com"
}

$ jq '.info |.[].name ' jq.json 
"Larry Deng"
"Larry"
"LarryDpk"

$ jq '.info |.[].webSite ' jq.json 
"www.pkslow.com"
"pkslow.com"
"https://www.pkslow.com"

9、紧凑输出 jq -c:

-c 选项表示输出紧凑格式的 JSON,去掉了换行和多余的空格,使输出更紧凑。这对于需要将 JSON 作为字符串传递给其他命令(例如在变量中使用时)很有用,因为它可以避免额外的换行符和空格干扰。

  

 

 

 jq Manual (development version) (stedolan.github.io)   jq官网示例







 

posted @ 2020-12-02 21:03  凡人半睁眼  阅读(1812)  评论(0编辑  收藏  举报