HIVE-默认分隔符以及linux系统中特殊字符的输入和查看方式
参考:http://www.jb51.net/article/97768.htm
一、查看特殊字符
Vim中可见特殊字符会直接显示,不可见特殊字符会显示为该字符在命令行的输入方式, 例如\r显示为^M。通过:help digraph-table可看到所有Vim中可输入的特殊字符, 该文档的第一页如下:
char digraph hex dec official name ^@ NU 0x00 0 NULL (NUL) ^A SH 0x01 1 START OF HEADING (SOH) ^B SX 0x02 2 START OF TEXT (STX) ^C EX 0x03 3 END OF TEXT (ETX) ^D ET 0x04 4 END OF TRANSMISSION (EOT) ^E EQ 0x05 5 ENQUIRY (ENQ) ^F AK 0x06 6 ACKNOWLEDGE (ACK) ^G BL 0x07 7 BELL (BEL) ^H BS 0x08 8 BACKSPACE (BS) ^I HT 0x09 9 CHARACTER TABULATION (HT) ^@ LF 0x0a 10 LINE FEED (LF) ^K VT 0x0b 11 LINE TABULATION (VT) ^L FF 0x0c 12 FORM FEED (FF) ^M CR 0x0d 13 CARRIAGE RETURN (CR)
第一列为特殊字符,第二列为digraph(见下文),第三列为十六进制表示, 第四列为十进制表示,第五列为该字符的官方名称。
显示当前文件的二进制编码可输入: %!xxd
,该命令会替换文件内容!恢复:: %!xdd -r
。
二、通过digraph输入
Vim中显然没有什么特殊字符选择工具,但提供了两种输入特殊字符的方式:
1、通过两个字符来输入一个特殊字符(digraph)。
2、直接通过编码值(ASCII或Unicode)输入。
其中digraph是一种类似双拼的方法,连续输入两个字符来表示一个特殊字符。 需要先按下前导键<Ctrl-K>,例如在编辑模式下输入:
将会出现®字符,其中"Rg"是该字符的digraph(双拼)。 所有的digraph可以通过:help digraph-table
查询。
三、通过字符编码输入
除了digraph,还可直接通过字符编码来输入它,该字符不需要在Vim的digraph-table中。 这种方式也是在插入模式下进行的,需要先按下前导键<Ctrl-V>
(Windows下<Ctrl-Q
>)。
有下列5种方式:
十进制值ASCII:^Vnnn (000 <= nnn <= 255)
八进制值:^VOnnn 或 ^Vonnn (000 <= nnn <= 377)
十六进制值:^VXnn or ^Vxnn (00 <= nn <= FF)
十六进制BMP Unicode:^Vunnnn (0000 <= nnnn <= FFFF)
十六进制任何Unicode:^VUnnnnnnnn (00000000 <= nnnnnnnn <= 7FFFFFFF)
上述操作都是在Unicode字符编码设置下进行的。例如:
<Ctrl-V>065
将会输出A字符,65是它的ASCII编码,而Unicode兼容ASCII。
四、换行的搜索/替换/输入
换行在Vim中的行为很特殊也不够一致,需要单独讨论一下。
首先区分一下\r和\n:
前者是回车(Carriage Return),在Vim中可通过<c-k>CR输入,显示为^M。
后者是换行(New Line),在Vim中通过<CR>(回车)键输入,显示为回车并换行;
所以对于Windows风格换行(\r\n)在Vim中会在每行结尾显示^M。
替换
注意使用:s命令替换为换行(New Line)时,应当使用\r(相当于回车键)而不是\n。 例如将所有逗号替换为换行:
:%s/,/\r
/g
如果使用\n则目标会被替换为空字符NULL(显示为^@)。
将DOS风格换行(\r\n)的文件转为Unix风格换行(\n)其实很简单,不需要手动查找替换:
搜索
在搜索模式(/)搜索换行时仍然应当使用\n字符,因为Vim的换行(Unix风格)确实是\n而不是\r\n。例如:
可以匹配到所有的:
五、查看不可见字符
除了特殊字符外,ASCII字符中还有大量的不可见字符,例如空格回车制表符等。 这些字符可以通过list变量来控制它们的显示与否:
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能有所帮助,如果有疑问大家可以留言交流。