摘要: HDFS原理由nameNode记录,由dataNode存储,存储方式应该可以配置,但是要存储与查看要通过命令,而不能直接查看(粗略理解,肯定在磁盘上是可以看到的三,不过在哪里喃,还没切看) 推送文件到HDFS hadoop fs -put 本地 集群 eg: hadoop fs -put /lw.t 阅读全文
posted @ 2016-07-19 16:02 鎏鑫岁月 阅读(154) 评论(0) 推荐(0) 编辑
摘要: spark.mllib contains the original API built on top of RDDs. spark.mllib 包含原始API构建于RDD之上。spark.ml provides higher-level API built on top of DataFrames 阅读全文
posted @ 2016-07-19 13:56 鎏鑫岁月 阅读(378) 评论(0) 推荐(0) 编辑