Hive 默认分隔符
引言
Hive 中的默认分隔符是 ^A (\001) ,这是一种特殊的分隔符,使用的是 ASCII 编码的值,键盘是打不出来的
查看 Hive 默认分隔符文件
Linux 上的文件
- 以 \001 作为分隔符时,下载后用 notePad++ 打开时看到的 SOH
- 以 \002 作为分隔符时,下载后用notePad++打开时看到的 STX,
- 以 \003 作为分隔符时,下载后用notePad++打开时看到的 ETX;
"\001" “\002” "\003"分隔是程序代码中进行解析需要的。
所以,notePad++ 打开后显示的分隔符正常
如何编写 Hive 默认分隔符文件
- 方法一:notePad++ 字符面板
从 ASCII 输入面板中选择需要输入的字符即可
- 方法二:字符替换
通过字符替换输入八进制的 ASCII 码,可以实现输入特殊字符