CDH - 随笔分类 - 米兰的小铁將

CDH /var/lib/cloudera-service-monitor和/var/lib/cloudera-host-monitor占用空间过大

摘要：1、/var/lib/cloudera-service-monitor和/var/lib/cloudera-host-monitor 这两个是cloudera managerment service服务的默认存储路径，最好改掉，换到大的分区下； 2、空间清理 /var/lib/cloudera-se 阅读全文

posted @ 2023-07-11 14:46 米兰的小铁將阅读(524) 评论(0) 推荐(0)

CDH中HDFS、Yarn开启HA

摘要：环境说明：CDH5.16.2 集群新搭建完成；接下来准备开启HDFS、Yarn的HA；一、HDFS开启HA 1、进入hdfs组件，在“操作”中启用HA HDFS的HA是指NameNode的高可用 2、输入Nameservice名称如果公司有多个集群，Nameservice名称不要设置重复了, N 阅读全文

posted @ 2022-03-14 17:42 米兰的小铁將阅读(890) 评论(0) 推荐(0)

CDH和HDP配置自带的邮件告警

摘要：邮件服务器主机名称：根据自己实际情况选择，可用smtp.163.com、smtp.qq.com等；邮件服务器用户名：对应邮件服务器的邮箱账号，比如 xxx@qq.com等；邮件服务器密码：对应用户名的密码，如果使用QQ邮箱作为“邮件服务器用户名”，那么这里的密码要填写QQ邮箱的授权码，具体阅读全文

posted @ 2022-03-08 15:53 米兰的小铁將阅读(994) 评论(0) 推荐(0)

CDH5.16.2集群搭建

摘要：1、主机准备这里以三节点为例；准备三台环境纯净的centos7主机，要可以正常连接yum源, root用户操作；随便安装一个包，测试一下yum: yum -y install lrzsz 主机情况：2核 4G，硬盘40G；这个配置其实太小，单节点内存尽量要给到8G以上比较好；主机资源看个人阅读全文

posted @ 2022-01-13 15:06 米兰的小铁將阅读(524) 评论(0) 推荐(0)

CDH中spark-shell报错: Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream

摘要：CDH5.8中使用spark-shell时报错：原因是CDH版的Spark从1.4版本以后，Spark编译时都没有将hadoop的classpath编译进去，所以必须在spark-env.sh中指定hadoop中的所有jar包。设置，所有节点都要改：在spark-env.sh中添加一条配置信息，将hadoop的classpath引入, ${HADOOP_HOME}根据自己的情况而定，直接写绝对路径... 阅读全文

posted @ 2020-05-27 17:17 米兰的小铁將阅读(1323) 评论(0) 推荐(0)

impala进阶

摘要：一、impala存储1、文件类型2、压缩方式二、impala分区1、创建分区方式partitioned by 创建表时，添加该字段指定分区列表：create table t_person(id int, name string, age int) partitioned by (type string);使用alter table 进行分区的添加和删除操作：alter table t_person... 阅读全文

posted @ 2019-12-04 14:20 米兰的小铁將阅读(1964) 评论(0) 推荐(0)

impala入门

摘要：一、概述Impala 是参照google 的新三篇论文Dremel(大批量数据查询工具)的开源实现，功能类似shark（依赖于hive）和Drill（apache），impala 是clouder 公司主导开发并开源，基于hive并使用内存进行计算，兼顾数据仓库，具有实时，批处理，多并发等优点。是使用cdh 的首选PB 级大数据实时查询分析引擎。(也可以单独安装使用，但一般都是和CDH一起使用；)... 阅读全文

posted @ 2019-12-04 11:17 米兰的小铁將阅读(2534) 评论(0) 推荐(0)

米兰的小铁將

随笔分类 - CDH

公告