PurStar

2017年1月17日

摘要： 0.抱怨与其他（此部分与标题没有太多联系）：首先一点想说的是版本问题，为什么标题我会写清楚版本号呢！原因就是版本不对真的很会坑人。就在写这篇博客的同一天，我还写了另一篇，是 Hadoop2.7.3+Spark2.1.0 完全分布式环境搭建全过程坑人的地方在哪里呢，Zeppelin0.6.2不阅读全文

posted @ 2017-01-17 20:11 PurStar 阅读(2634) 评论(0) 推荐(0)

Hadoop2.7.3+Spark2.1.0 完全分布式环境搭建全过程

摘要：一、修改hosts文件在主节点，就是第一台主机的命令行下; vim /etc/hosts 我的是三台云主机：在原文件的基础上加上; ip1 master worker0 namenode ip2 worker1 datanode1 ip3 worker2 datanode2 其中的ipN代表一个阅读全文

posted @ 2017-01-17 16:26 PurStar 阅读(39746) 评论(3) 推荐(1)

2017年1月14日

分别使用Hadoop和Spark实现二次排序

摘要：零、序（注意本部分与标题无太大关系，可直接翻到第一部分）既然没用为啥会有序？原因不想再开一篇文章，来抒发点什么感想或者计划了，就在这里写点好了：前些日子买了几本书，打算学习和研究大数据方面的知识，一直因为实习、考试、毕业设计等问题搞得没有时间，现在进入了寒假，可以安心的学点有用的知识了。这篇博阅读全文

posted @ 2017-01-14 23:42 PurStar 阅读(4675) 评论(0) 推荐(0)

2016年11月16日

Ubuntu16.04下将hadoop2.7.3源代码导入到eclipse neon中

摘要： 0.为什么会有这篇：这篇文章的目的在于帮助想学习hadoop源码的内容，却在导入的过程中出现了各种问题的人。或许你一定找了很多博客都无果，那么不用担心，我和你一样，这也是这篇文章存在的意义，废话少说，进入正题。导入的主要过程如下： 1.下载源代码：首先，登录hadoop的官网（http:// 阅读全文

posted @ 2016-11-16 19:46 PurStar 阅读(1181) 评论(0) 推荐(0)

2016年10月27日

HBase学习----windows10下使用eclipse搭建HBase的开发环境

摘要：以下是我搭建HBase开发环境的一些心得（windows10） 0.安装JDK和eclipse和一个可用的HBase。这步是最基础的，在此就不赘述了 1.创建一个java项目：基础问题，不赘述。 2.导入需要的jar包官网下载对应的二进制包，将lib文件下的jar包导入（右键--> build 阅读全文

posted @ 2016-10-27 18:43 PurStar 阅读(1974) 评论(0) 推荐(0)

2016年10月17日

大数据学习之路------借助HDP SANDBOX开始学习

摘要：一开始... 一开始知道大数据这个概念的时候，只是感觉很高大上，引起了我的兴趣。当时也不知道，这个东西是做什么的，有什么用，当然现在看来也是很模糊的样子，但是的确比一开始强了不少。所以学习的过程可能会很艰辛甚至有时候会很缓慢，但是感觉这东西未来会很有用途，最初了解大数据是从《大数据时代》这本书开始阅读全文

posted @ 2016-10-17 10:42 PurStar 阅读(9539) 评论(0) 推荐(1)

公告