摘要: Hadoop中的文件格式大致上分为面向行和面向列两类: 面向行:同一行的数据存储在一起,即连续存储。SequenceFile,MapFile,Avro Datafile。采用这种方式,如果只需要访问行的一小部分数据,亦需要将整行读入内存,推迟序列化一定程度上可以缓解这个问题,但是从磁盘读取整行数据的 阅读全文
posted @ 2021-06-26 23:41 落花桂 阅读(794) 评论(0) 推荐(0) 编辑
返回顶端
Live2D