最近不同的开发同事由于在代码文件中采用的 换行符 不同,而导致了在git merge代码阶段diff操作时增加了额外的人工判断成本,
如下图
回顾一下 换行符 的几种标准,来源历史就不说了,可以百度一下。
打开任何一个IDE都能看到类似的Code Style设置,Mac(\r) 这种机已经不生产了。
BUT 还有一种 “换行符”,留在文末补充中说。
先上一张 ASCII 表,后面分析问题要用到:man ascii
回来说一下我们遇到的问题,初看起来像 图一,就是多了个^M,
但仔细看一下二进制格式(通过xxd可以看到二进制下的情况),就看出是可以分成两种情况的
情况一:就是不同换行符的问题
L3有^M,但L4没有^M
这种情况下 类似dos2unix 或者tr 命令就可以处理了
情况二:不止是不同换行符,还多了一个\r (0x0D)
这种情况下 唯有用sed处理了。
最后,我们统一为Unix换行符(\n),写个脚本把所有的\r(0x0D)都删除了(不管是情况一还是情况二),再推回git。
find . -type f -name "*.php" ! -path "./.*" -exec sed -i 's/\x0D//g' {} \;
修正原有的代码文件问题后,统一 一下 git 的配置:
#提交时转换为LF,检出时转换为CRLF git config --global core.autocrlf true #拒绝提交包含混合换行符的文件 git config --global core.safecrlf true
================= 补充 =================
不知道大家有没有看到 ASCII 表上第一个 NUL 字符,常见的用法是 find -print0 ... | xargs -0 .... 、perl -0 ....
伪换行符一个。