摘要: 0.抱怨与其他(此部分与标题没有太多联系): 首先一点想说的是版本问题,为什么标题我会写清楚版本号呢!原因就是版本不对真的很会坑人。 就在写这篇博客的同一天,我还写了另一篇,是 Hadoop2.7.3+Spark2.1.0 完全分布式环境 搭建全过程 坑人的地方在哪里呢,Zeppelin0.6.2不 阅读全文
posted @ 2017-01-17 20:11 PurStar 阅读(2607) 评论(0) 推荐(0) 编辑
摘要: 一、修改hosts文件 在主节点,就是第一台主机的命令行下; vim /etc/hosts 我的是三台云主机: 在原文件的基础上加上; ip1 master worker0 namenode ip2 worker1 datanode1 ip3 worker2 datanode2 其中的ipN代表一个 阅读全文
posted @ 2017-01-17 16:26 PurStar 阅读(39578) 评论(3) 推荐(1) 编辑
摘要: 零、序(注意本部分与标题无太大关系,可直接翻到第一部分) 既然没用为啥会有序?原因不想再开一篇文章,来抒发点什么感想或者计划了,就在这里写点好了: 前些日子买了几本书,打算学习和研究大数据方面的知识,一直因为实习、考试、毕业设计等问题搞得没有时间,现在进入了寒假,可以安心的学点有用的知识了。 这篇博 阅读全文
posted @ 2017-01-14 23:42 PurStar 阅读(4635) 评论(0) 推荐(0) 编辑
摘要: 0.为什么会有这篇: 这篇文章的目的在于帮助想学习hadoop源码的内容,却在导入的过程中出现了各种问题的人。 或许你一定找了很多博客都无果,那么不用担心,我和你一样,这也是这篇文章存在的意义,废话少说,进入正题。 导入的主要过程如下: 1.下载源代码: 首先,登录hadoop的官网(http:// 阅读全文
posted @ 2016-11-16 19:46 PurStar 阅读(1159) 评论(0) 推荐(0) 编辑
摘要: 以下是我搭建HBase开发环境的一些心得(windows10) 0.安装JDK和eclipse和一个可用的HBase。 这步是最基础的,在此就不赘述了 1.创建一个java项目: 基础问题,不赘述。 2.导入需要的jar包 官网下载对应的二进制包,将lib文件下的jar包导入(右键--> build 阅读全文
posted @ 2016-10-27 18:43 PurStar 阅读(1916) 评论(0) 推荐(0) 编辑
摘要: 一开始... 一开始知道大数据这个概念的时候,只是感觉很高大上,引起了我的兴趣。当时也不知道,这个东西是做什么的,有什么用,当然现在看来也是很模糊的样子,但是的确比一开始强了不少。 所以学习的过程可能会很艰辛甚至有时候会很缓慢,但是感觉这东西未来会很有用途,最初了解大数据是从《大数据时代》这本书开始 阅读全文
posted @ 2016-10-17 10:42 PurStar 阅读(9371) 评论(0) 推荐(1) 编辑