Fork me on GitHub
摘要: Hive是什么? 由Facebook开源用于解决海量 结构化日志的数据统计; Hive是基于Hadoop的一个 数据仓库工具,可以将结构化的数据文件映射 成一张表,并提供类SQL查询功能; 构建在Hadoop 之上的数据仓库; 1. 使用HQL作为查询接口; 2. 使用HDFS存储; 3. 使用Ma 阅读全文
posted @ 2018-03-17 19:00 迁梦余光 阅读(271) 评论(0) 推荐(0) 编辑
摘要: :1 跳转到第一行 :$ 跳转到最后一行 /字符串 查找字符串,按 “n” 继续查收 替换 :s/vivian/sky/ 替换当前行第一个 vivian 为 sky :s/vivian/sky/g 替换当前行所有 vivian 为 sky :n,$s/vivian/sky/ 替换第 n 行开始到最后 阅读全文
posted @ 2018-03-17 17:13 迁梦余光 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 动态添加 DataNode 节点 hadoop环境是必须的 需要加入新的 DataNode 节点,前提是已经配置好 SSH 无密登录;直接复制已有DataNode中.ssh目录中的authorizedkeys和idrsa。 在新DataNode上启动hadoop hadoop-daemon.sh s 阅读全文
posted @ 2018-03-17 13:23 迁梦余光 阅读(334) 评论(0) 推荐(0) 编辑