05 2017 档案
摘要:Linux 操作系统常用的三种流: 0 标准输入流 1 标准输出流 2 标准错误流 通常在写脚本启动程序,写log时候,会出现如下写法: nohup commod > log.txt 2>&1 & 解释:表示通过nohup 启动服务 > log.txt 表示 标准输出流写入到 log.txt 文件
阅读全文
摘要:标题比较笼统,实际情况是: 对于Hive 的分区外部表的已有分区,在对表新增或者修改字段后,相关分区不生效。 原因是:表元数据虽然修改成功,但是分区也会对应列的元数据,这个地方不会随表的元数据修改而修改. 处理办法: 有两种 第一种:修改表,然后对于需要生效的分区,先drop 再 add. (或者说
阅读全文
摘要:坑点: 压缩后的byte 数组中会有元素是负数,如果转化成String 存入文件,然后再读取解压缩还原,无法得到原来的结果,甚至是无法解压缩。 原因分析: String 底层是由char 数组构成的,而char 在java 中存储是2字节的无符号数,所以负数byte 在存入String 后转化成对应
阅读全文
摘要:英文分词 由于英语的基本组成单位就是词,所以相对来说简单很多。 大致分为三步(3S): 1、根据空格拆分单词 这一步是是最简单的一步,英语的句子基本上就是由标点符号、空格和词构成,那么只要根据空格和标点符号将词语分割成数组即可。 如“Nobody knows how ancient people s
阅读全文