08 2017 档案

摘要:这个实验,演示了分区表和非分区表的关系。值分区表的orc文件不保存分区列的值。 下面试着演示范围分区: 用dfs -ls 找出有数据的目录,然后将数据load到对应非分区表user9_0中。 结果如下,说明范围分区表中的orc文件有和对应非分区表相同数量的列。 阅读全文
posted @ 2017-08-23 23:23 阿梁的新博客 阅读(730) 评论(0) 推荐(0) 编辑
摘要:随后用dfs命令查看user1的表目录。可见有000000_0文件。删除后表中无数据。重新填充数据准备后续实验。 创建了user1_0和user1有相同的列定义,都存成orc格式。 将user1表目录中的文件copy到user1_0表。则user1_0表也有了数据。由此了解orc表和表目录下文件的关 阅读全文
posted @ 2017-08-23 22:52 阿梁的新博客 阅读(899) 评论(0) 推荐(0) 编辑
摘要:此时可见user2目录下有partition=girl和partition=boy两个子目录。 此时可见sex=girl目录下有两个文件000000_0,000001_0 因为分为两个桶。根据hash规则,age=17,17%2=1,则数据在000001_0的文件中。删掉此文件。 可见user2变空 阅读全文
posted @ 2017-08-23 21:47 阿梁的新博客 阅读(523) 评论(0) 推荐(0) 编辑