宽字符截断的原理主要涉及字符编码的处理方式，特别是在多字节字符集（如GBK、BIG5等）中。这种漏洞通常发生在web应用对用户输入进行过滤时，由于字符编码的不一致导致的。

原理

多字节字符集中，一个字符通常由两个或更多字节组成。
在进行字符串操作时，如果不正确处理这些多字节字符，可能会导致字符被错误地截断或解释。
攻击者可以利用这一点，构造特殊的输入来绕过安全过滤。
具体例子：
假设有一个PHP应用使用GBK编码，并使用addslashes()函数来转义特殊字符以防止SQL注入。

考虑以下场景：
用户输入：%df' （其中%df是宽字符的第一个字节）
addslashes()函数会在单引号前添加一个反斜杠，变成：%df' ，

在GBK编码中，%df%5c正好是一个合法的宽字符
结果是，反斜杠被当作宽字符的一部分，失去了转义的作用
最终在数据库查询中，单引号逃逸出来，可能导致SQL注入。

$input = "%df'";
$escaped = addslashes($input);
// $escaped 现在是 "%df\'"，但在GBK编码下，\' 会被视为一个字符

$query = "SELECT * FROM users WHERE name = '$escaped'";
// 实际的查询变成：SELECT * FROM users WHERE name = '%df''

防御措施

1.使用参数化查询而不是字符串拼接
2.确保整个应用使用一致的字符编码（最好是UTF-8）
3.在进行安全过滤之前，先将输入转换为安全的字符编码
4.使用专门设计用于防止SQL注入的函数，如mysqli_real_escape_string()
5.理解并防范宽字符截断漏洞对于确保web应用的安全性非常重要，尤其是在处理多语言或遗留系统时。

posted on 2024-07-16 16:15 Mysticbinary 阅读(161) 评论(0) 收藏举报

刷新页面返回顶部