hadoop2.x之IO:基于文件的数据结构
摘要:
备注 二进制文件广义上讲是所有文件(在物理上所有文件都是二进制编码)。狭义上是指文本文件以外的文件 。而文本文件又是指ASCII或unicode编码的文件,二者在物理上没有本质的区别,只是逻辑上的概念。所以二进制文件在这里指的是所有文件。 Hadoop主要处理日志文件,其中每一行文本代表一条日志记录 阅读全文
posted @ 2017-08-13 09:56 erygreat 阅读(158) 评论(0) 推荐(0) 编辑