虎啸千峰

2024年1月29日

摘要：一、问题现象 SparkSQL创建多个session报错，不能创建一个链接，链接Spark自带的数据库derby 2024-01-25 19:50:59.053 [INFO ]24/01/25 19:50:59 INFO !PLExecution!: Execute SQL: DROP TABLE 阅读全文

posted @ 2024-01-29 19:38 虎啸千峰阅读(143) 评论(0) 推荐(0)

2024年1月13日

Spark版本不兼容导致Standalone集群无法连接问题

摘要：一、Spark版本不一致报错现象当使用client模式连接Spark的standalone集群时，报错所有的spark master的节点都没有回应。二、问题排查思路通过client端的日志产看没有什么有价值的信息，需要看下spark端的master的日志，docker logs spark- 阅读全文

posted @ 2024-01-13 14:45 虎啸千峰阅读(576) 评论(0) 推荐(0)

Spark读写达梦数据库报错Decimal精度为负数以及解决方案

摘要：一、Spark读取DM数据库问题描述当达梦的表格设计使用number数据类型时，如果没有指定精确，使用默认值，如下图所示则在读取该表格数据时，报错如下： 24/01/12 10:43:48 ERROR Node: [47db01a8b6ff47e7840cb0a777033721]:compon 阅读全文

posted @ 2024-01-13 11:47 虎啸千峰阅读(709) 评论(0) 推荐(0)

2024年1月12日

防火墙添加允许服务器IP和端口方法

摘要：一、检测防火墙命令 systemctl status firewalld 如果显示如下active表示防火墙开启 ● firewalld.service - firewalld - dynamic firewall daemon Loaded: loaded (/usr/lib/systemd/sy 阅读全文

posted @ 2024-01-12 16:27 虎啸千峰阅读(1997) 评论(0) 推荐(0)

2022年5月5日

防止Oracle长任务被卡住方法

摘要：一、背景客户生产环境数据量比较大的时候，有一个存储过程作业需要执行22min左右，这个作业经常出现数据库作业已经执行完毕，而大数据平台还显示正在执行中的问题。导致整个业务流程无法顺利完成。二、原因探究 2.1 原因分析由于oracle的存储过程使用的是jdbc的statement.execut 阅读全文

posted @ 2022-05-05 20:01 虎啸千峰阅读(2270) 评论(0) 推荐(0)

合并文件解决HiveServer2内存溢出方法

摘要：一、背景客户现场的CDH6.x版本的集群执行一个大分区表时hiveserver2发生了内存溢出。下面针对该问题进行了复现并深入了解了hiveserver2内存加载使用原理；提出了解决此类问题的方案，具体内容如下。二、HiveServer2内存溢出 2.1查看表文件个数 desc formatt 阅读全文

posted @ 2022-05-05 19:53 虎啸千峰阅读(1217) 评论(0) 推荐(0)

CDH升级到CDP大数据集群碰到的问题解析

摘要：一、背景 2019 年，Cloudera 与 Hortonworks 合并后，彻底完成了转型。Cloudera 果断宣布，对 CDH 和 HDP 两条产品线将仅支持到 2022 年。对于两个产品高度重合的部分会做删减和融合，结果就是推出新的数据平台 CDP （Cloudera Data Platfo 阅读全文

posted @ 2022-05-05 19:43 虎啸千峰阅读(1946) 评论(0) 推荐(0)

解析集群中Hive作业返回错误码释义以及解决方法

摘要：一、背景作为大数据常用的组件Hive，其在执行作业异常时会返回一些错误码。但是，hive返回的错误概括性比较强，往往看不出来具体的信息，需要进入到集群中查看详细的yarn执行日志或者hiveserver2的日志才能定位出具体的原因。本文针对客户生产环境中常见的Hive返回的错误码进行释义，并提出阅读全文

posted @ 2022-05-05 19:39 虎啸千峰阅读(1903) 评论(0) 推荐(0)

EMR大数据平台开启kerberos方法

摘要： 1 本地源配置服务器本地源没有配置，导致不能连接外网，参考其他可以连接外网的服务器，配置本地源。配置方法： 1.1打开CentOS.repo文件并修改 Vi /etc/yum.repos.d/CentOS.repo 1.2增加yum配置 [base] name=CentOS-$releasever 阅读全文

posted @ 2022-05-05 19:32 虎啸千峰阅读(436) 评论(0) 推荐(0)

2022年2月9日

CDP大数据平台hive表格与CDH的不同

摘要：一、概述 CDP大数据平台是CDH和HDP合并之后的新版本，使用的hive是3.0版本。CDP在使用上和CDH有很大的不同。二、Hive默认创建表格不同 CDP默认创建的表格都是事务表；可以进行增、删、改、查操作，不支持设置事务表的相关参数；应该是默认已经设置好了。而CDH需要指定创建的表格时事务阅读全文

posted @ 2022-02-09 19:54 虎啸千峰阅读(1330) 评论(0) 推荐(1)

公告