Hive 默认分隔符

引言

Hive 中的默认分隔符是 ^A (\001) ,这是一种特殊的分隔符,使用的是 ASCII 编码的值,键盘是打不出来的

查看 Hive 默认分隔符文件

Linux 上的文件

  • 以 \001 作为分隔符时,下载后用 notePad++ 打开时看到的 SOH
  • 以 \002 作为分隔符时,下载后用notePad++打开时看到的 STX,
  • 以 \003 作为分隔符时,下载后用notePad++打开时看到的 ETX;

"\001" “\002” "\003"分隔是程序代码中进行解析需要的。

所以,notePad++ 打开后显示的分隔符正常

如何编写 Hive 默认分隔符文件

  • 方法一:notePad++ 字符面板

从 ASCII 输入面板中选择需要输入的字符即可

  • 方法二:字符替换

通过字符替换输入八进制的 ASCII 码,可以实现输入特殊字符

posted @ 2021-04-22 12:24  Binge-和时间做朋友  阅读(3957)  评论(0编辑  收藏  举报