Spark集群搭建（1、3和5节点）（含CentOS系统和Ubuntu系统） - 随笔分类 - 大数据和AI躺过的坑

ubuntu系统里vi编辑器时，按方向箭头输入是乱码的ABCD字母？（图文详解）

摘要：不多说，直接上干货！问题详情 ubuntu系统里vi编辑器时，按方向箭头输入是乱码的ABCD字母？解决办法是由于预装的vim软件没更新，运行 sudo apt-get install vim 安装最新的即可解决！欢迎大家，加入我的微信公众号：大数据躺过的坑人工智能躺过的坑同时，大家可以关阅读全文

posted @ 2017-06-06 23:19 大数据和AI躺过的坑阅读(1534) 评论(0) 推荐(0)

hadoop-2.7.3.tar.gz + spark-2.0.2-bin-hadoop2.7.tgz + zeppelin-0.6.2-incubating-bin-all.tgz（master、slave1和slave2）（博主推荐）（图文详解）

摘要：不多说，直接上干货！我这里，采取的是ubuntu 16.04系统，当然大家也可以在CentOS6.5里，这些都是小事 CentOS 6.5的安装详解 hadoop-2.6.0.tar.gz + spark-1.5.2-bin-hadoop2.6.tgz的集群搭建（单节点）（Ubuntu系统）大数阅读全文

posted @ 2017-06-06 09:47 大数据和AI躺过的坑阅读(1653) 评论(0) 推荐(0)

hadoop-2.6.0.tar.gz + spark-1.6.1-bin-hadoop2.6.tgz + zeppelin-0.5.6-incubating-bin-all.tgz（master、slave1和slave2）（博主推荐）（图文详解）

摘要：不多说，直接上干货！我这里，采取的是CentOS6.5，当然大家也可以在ubuntu 16.04系统里，这些都是小事 CentOS 6.5的安装详解 hadoop-2.6.0.tar.gz + spark-1.5.2-bin-hadoop2.6.tgz的集群搭建（单节点）（Ubuntu系统）大数阅读全文

posted @ 2017-06-06 09:44 大数据和AI躺过的坑阅读(1295) 评论(0) 推荐(0)

CentOS和Ubuntu系统下安装vsftp（助推大数据部署搭建）

摘要：不多说，直接上干货！同时，声明，我这里安装的vsftp，仅仅只为我的大数据着想，关于网上的复杂安装，那是服务和运维那块。我不多牵扯，也不多赘述。一、CentOS系统里安装vsftp 第一步：使用yum命令安装vsftp 第二步：配置vsftpd文件第三步：配置这里我使用的是匿名登录（保存默认阅读全文

posted @ 2017-05-06 10:45 大数据和AI躺过的坑阅读(471) 评论(0) 推荐(0)

大数据搭建各个子项目时配置文件技巧（适合CentOS和Ubuntu系统）（博主推荐）

摘要：不多说，直接上干货！很多同行，也许都知道，对于我们大数据搭建而言，目前主流，分为Apache 和 Cloudera 和 Ambari。后两者我不多说，是公司必备和大多数高校科研环境所必须的！分别，详情见我如下的博客 Cloudera安装搭建部署大数据集群（图文分五大步详解）（博主强烈推荐） A 阅读全文

posted @ 2017-05-06 09:17 大数据和AI躺过的坑阅读(2943) 评论(0) 推荐(0)

关于大数据领域各个组件打包部署到集群运行的总结（含手动和maven）（博主推荐）

摘要：对于这里的打包，总结： (1) 最简单的，也是为了适应公司里，还是要用maven，当然spark那边sbt，maven都可以。但是maven居多。 Eclipse/MyEclipse下如何Maven管理多个Mapreduce程序？（企业级水平） IDEA里如何多种方式打jar包，然后上传到集群 Sp 阅读全文

posted @ 2017-05-03 16:19 大数据和AI躺过的坑阅读(1001) 评论(0) 推荐(0)

hadoop job -kill 与 yarn application -kii（作业卡了或作业重复提交或MapReduce任务运行到running job卡住）

摘要：问题详情解决办法有时候上述这样kill做下来，并不管用，得再来同时，大家要注意，是否是进程的消失？也会是你的slave1 还是 slave2的进程自动消失了。注意，这是个很隐蔽的问题。重新停止集群，再重新启动集群。如果还是出现这个问题的话，则 MapReduce任务运行到running 阅读全文

posted @ 2017-05-03 14:49 大数据和AI躺过的坑阅读(15510) 评论(0) 推荐(0)

再谈spark部署搭建和企业级项目接轨的入门经验（博主推荐）

摘要：进入我这篇博客的博友们，相信你们具备有一定的spark学习基础和实践了。先给大家来梳理下。spark的运行模式和常用的standalone、yarn部署。这里不多赘述，自行点击去扩展。 1、Spark运行模式概述 2、Spark standalone模式的安装（spark-1.6.1-bin-ha 阅读全文

posted @ 2017-04-25 11:50 大数据和AI躺过的坑阅读(511) 评论(0) 推荐(0)

如何成功且顺序的进入centos系统的安全模式？（图文详解）

摘要：说白了，这个很简单！见 -bash : ** : command not found的问题解决（图文详解）阅读全文

posted @ 2017-04-24 10:32 大数据和AI躺过的坑阅读(3419) 评论(0) 推荐(0)

-bash : ** : command not found的问题解决（图文详解）

摘要：问题来源我不小心，配置错了，少了个export和PATH没配对。 source /etc/profile 之前一定要留心，否则出错让你后悔去！问题导致现象1 问题导致现象2 解决办法按e键，进入再按e键，选择kernel选项再按e，输入single 输入“singel“ 或者是“1“”，又阅读全文

posted @ 2017-04-24 10:21 大数据和AI躺过的坑阅读(61433) 评论(0) 推荐(0)

Could not connect to '192.168.80.145' (port 22): Connection failed的解决办法（远程连不上xshell）

摘要：问题状况表现1 这个问题一般是你的什么配置影响了虚拟机的网卡网关设置！！！。问题状况表现2 这个问题一般是你的什么配置影响了虚拟机的网卡网关设置。解决办法网上的那些解决方案，我都试过，比如。 http://blog.csdn.net/fengasdfgh/article/details/6 阅读全文

posted @ 2017-04-21 21:52 大数据和AI躺过的坑阅读(55163) 评论(6) 推荐(0)

大数据各子项目的环境搭建之建立与删除软连接（博主推荐）

摘要：建立软连接，好处可以处理多个版本的需要，方便环境变量的配置。相当于windows下的快捷方式！博主，我这里以jdk为例，对于大数据的其他子项目的搭建，一样的操作。方便！这里我不多赘述。如何建立jdk1.7版本的软链接？如何删除建立好的软链接？如何建立jdk1.8版本的软链接？成功！补充阅读全文

posted @ 2017-04-12 10:18 大数据和AI躺过的坑阅读(1607) 评论(0) 推荐(0)

spark on yarn模式里需要有时手工释放linux内存

摘要：为什么要提出这个问题? spark跑YARN模式或Client模式提交任务不成功（application state: ACCEPTED）然后执行参考手工释放linux内存——/proc/sys/vm/drop_cache http://www.linuxidc.com/Linux/2010- 阅读全文

posted @ 2017-04-09 20:51 大数据和AI躺过的坑阅读(2225) 评论(0) 推荐(0)

spark跑YARN模式或Client模式提交任务不成功（application state: ACCEPTED）

摘要：不多说，直接上干货！问题详情电脑8G，目前搭建3节点的spark集群，采用YARN模式。 master分配2G，slave1分配1G,slave2分配1G。（在安装虚拟机时） export SPARK_WORKER_MERMORY=1g （在spark-env.sh）其实这个问题解决办法很简单阅读全文

posted @ 2017-04-09 09:58 大数据和AI躺过的坑阅读(25056) 评论(1) 推荐(1)

Spark Yarn-cluster与Yarn-client

摘要：摘要在Spark中，有Yarn-Client和Yarn-Cluster两种模式可以运行在Yarn上，通常Yarn-cluster适用于生产环境，而Yarn-Cluster更适用于交互，调试模式，以下是它们的区别 Spark插拨式资源管理 Spark支持Yarn,Mesos,Standalone三种阅读全文

posted @ 2017-03-29 16:27 大数据和AI躺过的坑阅读(2039) 评论(0) 推荐(0)

Spark Standalone与Spark on YARN的几种提交方式

摘要：不多说，直接上干货！ Spark Standalone的几种提交方式别忘了先启动spark集群！！！ spark-shell用于调试，spark-submit用于生产。 1.spark-shell client 2.spark-submit cluster Spark on YARN的几种提交方式阅读全文

posted @ 2017-03-29 15:54 大数据和AI躺过的坑阅读(3024) 评论(0) 推荐(0)

Spark on YARN简介与运行wordcount（master、slave1和slave2）（博主推荐）

摘要：前期博客 Spark on YARN模式的安装（spark-1.6.1-bin-hadoop2.6.tgz + hadoop-2.6.0.tar.gz）（master、slave1和slave2）（博主推荐） Spark运行模式概述 Spark On YARN模式这是一种很有前景的部署模式。但限于阅读全文

posted @ 2017-03-29 10:41 大数据和AI躺过的坑阅读(5878) 评论(0) 推荐(0)

Spark on YARN模式的安装（spark-1.6.1-bin-hadoop2.6.tgz + hadoop-2.6.0.tar.gz）（master、slave1和slave2）（博主推荐）

摘要：说白了 Spark on YARN模式的安装，它是非常的简单，只需要下载编译好Spark安装包，在一台带有Hadoop YARN客户端的的机器上运行即可。 Spark on YARN简介与运行wordcount（master、slave1和slave2）（博主推荐） Spark on YARN分为两阅读全文

posted @ 2017-03-29 10:32 大数据和AI躺过的坑阅读(3594) 评论(0) 推荐(0)

Spark standalone模式的安装（spark-1.6.1-bin-hadoop2.6.tgz）（master、slave1和slave2）

摘要：前期博客 Spark运行模式概述 Spark standalone简介与运行wordcount（master、slave1和slave2）开篇要明白（1）spark-env.sh 是环境变量配置文件（2）spark-defaults.conf （3）slaves 是从节点机器配置文件（4）m 阅读全文

posted @ 2017-03-28 10:00 大数据和AI躺过的坑阅读(1881) 评论(0) 推荐(0)

Spark standalone简介与运行wordcount（master、slave1和slave2）

摘要：前期博客 Spark standalone模式的安装（spark-1.6.1-bin-hadoop2.6.tgz）（master、slave1和slave2） Spark运行模式概述 1. Standalone模式即独立模式，自带完整的服务，可单独部署到一个集群中，无需依赖任何其他资源管理系统。从阅读全文

posted @ 2017-03-27 20:59 大数据和AI躺过的坑阅读(3442) 评论(0) 推荐(0)

大数据和人工智能躺过的坑

随笔分类 - Spark集群搭建（1、3和5节点）（含CentOS系统和Ubuntu系统）

公告