03 2019 档案

摘要:Hive官网(HQL)语法手册(英文版):https://cwiki.apache.org/confluence/display/Hive/LanguageManual Hive的数据存储 1、Hive中所有的数据都存储在 HDFS 中,没有专门的数据存储格式(可支持Text,SequenceFil 阅读全文
posted @ 2019-03-28 11:05 会飞的猪仔 阅读(886) 评论(0) 推荐(0) 编辑
摘要:reduce(binary_function) reduce将RDD中元素前两个传给输入函数,产生一个新的return值,新产生的return值与RDD中下一个元素(第三个元素)组成两个元素,再被传给输入函数,直到最后只有一个值为止。 具体过程,RDD有1 2 3 4 5 6 7 8 9 10个元素 阅读全文
posted @ 2019-03-26 16:27 会飞的猪仔 阅读(578) 评论(0) 推荐(0) 编辑
摘要:1. map会将每一条输入映射为一个新对象。{苹果,梨子}.map(去皮) = {去皮苹果,去皮梨子} 其中: “去皮”函数的类型为:A => B 2.flatMap包含两个操作:会将每一个输入对象输入映射为一个新集合,然后把这些新集合连成一个大集合。 {苹果,梨子}.flatMap(切碎) = { 阅读全文
posted @ 2019-03-26 16:00 会飞的猪仔 阅读(1273) 评论(0) 推荐(0) 编辑
摘要:原因是因为你的hadoop.tmp.dir在/tmp目录下,而linux系统的/tmp文件夹内容能够是定时清理的,所以会导致你看hadoop使用不了了,就反复的格式化namenode会导致上述问题,也有可能是datanode长期没正常启动导致;找了一下资料,有三个解决方案:解決方法一:删除 data 阅读全文
posted @ 2019-03-25 09:53 会飞的猪仔 阅读(1670) 评论(0) 推荐(0) 编辑
摘要:一. 分布式安装部署 1.0 下载地址 官网首页: https://zookeeper.apache.org/ 下载地址: http://mirror.bit.edu.cn/apache/zookeeper/ 1.1 集群规划 在node21、node22和ode23三个节点上部署Zookeeper 阅读全文
posted @ 2019-03-25 09:50 会飞的猪仔 阅读(290) 评论(0) 推荐(0) 编辑
摘要:一 完全分布式集群(单点) Hadoop官方地址:http://hadoop.apache.org/ 1 准备3台客户机 1.1防火墙,静态IP,主机名 关闭防火墙,设置静态IP,主机名此处略,参考 Linux之CentOS7.5安装及克隆 1.2 修改host文件 我们希望三个主机之间都能够使用主 阅读全文
posted @ 2019-03-25 09:49 会飞的猪仔 阅读(318) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示