摘要: Hadoop的数据管理,主要包括Hadoop的分布式文件系统HDFS、分布式数据库HBase和数据仓库工具Hive的数据管理。 阅读全文
posted @ 2014-07-16 17:06 侯凯 阅读(1401) 评论(0) 推荐(0) 编辑
摘要: HDFS和MapReduce是Hadoop的两大核心。而整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持的,并且它会通过MapReduce来实现对分布式并行任务处理的程序支持。 阅读全文
posted @ 2014-07-16 14:09 侯凯 阅读(2322) 评论(0) 推荐(0) 编辑
摘要: hadoop支持命令行操作HDFS文件系统,并且支持shell-like命令与HDFS文件系统交互,对于大多数程序猿/媛来说,shell-like命令行操作都是比较熟悉的,其实这也是Hadoop的极大便利之一,至少对于想熟悉乃至尽快熟练操作HDFS的人来说。 阅读全文
posted @ 2014-07-16 10:24 侯凯 阅读(2017) 评论(0) 推荐(0) 编辑