大数据 - 随笔分类 - AllEmpty

记录HBase手动删除Hadoop备份（archive）文件后，引发Hbase写入数据出错等一系列问题处理

摘要：由于需要规范HBase数据表命名，对测试环境的数据进行了重命名操作。停掉所有服务后执行下面改名操作 # 禁用活跃用户表 disable 'DC_XXL:ACTIVE_USERS' # 创建快照 snapshot 'DC_XXL:ACTIVE_USERS', 'tony_snapshot' # 克隆阅读全文

posted @ 2020-07-07 15:05 AllEmpty 阅读(2219) 评论(0) 推荐(0)

spark streaming连接kafka引发"partition.assignment.strategy"异常处理

摘要：服务器运行环境：spark 2.4.4 + scall 2.11.12 + kafka 2.2.2 由于业务相对简单，kafka只有固定topics，所以一直使用下面脚本执行实时流计算 spark-submit --packages org.apache.spark:spark-streaming- 阅读全文

posted @ 2020-03-18 10:58 AllEmpty 阅读(2539) 评论(0) 推荐(0)

Harbor本地镜像库安装与使用

摘要：Harbor安装很简单，不过安装以后要怎么操作，百度了好久都没有找到实操的方法，怎么从官方拉取镜像后更新到私有仓库中？这个弄了好久，一样样测试后才找到方法，对于不熟悉私有仓库的小白来说，有点坑。还好花了些时间解决了。 1. Harbor简介 Harbor安装很简单，不过安装以后要怎么操作，百度了好久阅读全文

posted @ 2019-12-30 19:48 AllEmpty 阅读(2464) 评论(1) 推荐(0)

大数据高可用集群环境安装与配置（10）——安装Kafka高可用集群

摘要：1. 获取安装包下载链接访问https://kafka.apache.org/downloads 找到kafka对应版本需要与服务器安装的scala版本一致（运行spark-shell可以看到当前安装的scala版本） 2. 执行命令下载并安装 cd /usr/local/src/ wget h 阅读全文

posted @ 2019-12-28 21:54 AllEmpty 阅读(342) 评论(0) 推荐(0)

大数据高可用集群环境安装与配置（09）——安装Spark高可用集群

摘要：1. 获取spark下载链接登录官网：http://spark.apache.org/downloads.html 选择要下载的版本 2. 执行命令下载并安装 cd /usr/local/src/ wget http://mirrors.tuna.tsinghua.edu.cn/apache/sp 阅读全文

posted @ 2019-12-28 21:50 AllEmpty 阅读(381) 评论(0) 推荐(0)

大数据高可用集群环境安装与配置（08）——安装Ganglia监控集群

摘要：1. 安装依赖包和软件 1. 安装依赖包和软件在所有服务器上输入命令进行安装操作 2. 在master服务器上配置监控端 vi /etc/ganglia/gmetad.conf 修改下面内容 data_source "server" 50 master:8649 master-backup:864 阅读全文

posted @ 2019-12-28 21:45 AllEmpty 阅读(430) 评论(0) 推荐(0)

大数据高可用集群环境安装与配置（07）——安装HBase高可用集群

摘要：1. 下载安装包登录官网获取HBase安装包下载地址 https://hbase.apache.org/downloads.html 2. 执行命令下载并安装 cd /usr/local/src/ wget http://archive.apache.org/dist/hbase/2.0.0/hb 阅读全文

posted @ 2019-12-28 21:40 AllEmpty 阅读(515) 评论(0) 推荐(0)

大数据高可用集群环境安装与配置（06）——安装Hadoop高可用集群

摘要：下载Hadoop安装包登录 https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ 镜像站，找到我们要安装的版本，点击进去复制下载链接安装Hadoop时要注意版本与后续安装的HBase、Spark等相关组件的兼容，不要安装了不匹配的版阅读全文

posted @ 2019-12-28 21:34 AllEmpty 阅读(451) 评论(0) 推荐(0)

大数据高可用集群环境安装与配置（05）——安装zookeeper集群

摘要：1. 下载安装包登录官网下载安装包 https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/ 2. 执行命令下载并安装 cd /usr/local/src/ wget https://mirrors.tuna.tsinghua.edu.cn/ap 阅读全文

posted @ 2019-12-28 21:23 AllEmpty 阅读(319) 评论(0) 推荐(0)

大数据高可用集群环境安装与配置（04）——安装JAVA运行环境

摘要：Hadoop运行在java环境，所以在安装Hadoop之前，需要安装好jdk 提前下载好jdk安装包（jdk-8u161-linux-x64.tar.gz），将它上传到指定的安装目录当中，然后运行安装配置服务器环境变量在尾部添加下面配置保存退出后，运行命令，让配置马上生效将java安装包同步阅读全文

posted @ 2019-12-28 21:19 AllEmpty 阅读(355) 评论(0) 推荐(0)

大数据高可用集群环境安装与配置（03）——设置SSH免密登录

摘要：Hadoop的NameNode需要启动集群中所有机器的Hadoop守护进程，这个过程需要通过SSH登录来实现 Hadoop并没有提供SSH输入密码登录的形式，因此，为了能够顺利登录每台机器，需要将所有机器配置为NameNode可以免密登录由于是双master，所以需要在master与master_ 阅读全文

posted @ 2019-12-28 21:17 AllEmpty 阅读(381) 评论(0) 推荐(0)

大数据高可用集群环境安装与配置（01）——服务器基础配置

摘要：这段时间在做大数据方面的开发，使用Hadoop、HBase、Spark、Spart Streaming、Kafka、Docker、Kubernetes等等平台与组件，在服务器运维方面也在模仿着别人重复造轮子。要基于这些系统进行开发，就必须搭建一套稳定的服务器环境，虽然网上有大量的文章与教程，但在学习阅读全文

posted @ 2019-12-28 21:09 AllEmpty 阅读(1529) 评论(0) 推荐(0)

AllEmpty

只有将自己置空，才能装进更多的东西！

随笔分类 - 大数据

公告