上一页 1 2 3 4 5 6 7 ··· 37 下一页
摘要: 背景 hive读取纯文本数据,无论是:原始格式、gzip、bzip,都可以自动识别,不需要修改建表语句或修改setting。 但是使用gobblin开启gzip压缩之后保存文件使用hive读取发生乱码。 定位 首先怀疑是文件损坏 gobblin开启压缩之后写的文件为:*.txt.gzip,将该文件下 阅读全文
posted @ 2022-05-19 16:32 匠人先生 阅读(521) 评论(0) 推荐(0) 编辑
摘要: 假如hive中table或者partition的location错误或者丢失,需要批量修复,可以参考如下步骤: 修复table的location hdfs dfs -ls /data/hive/warehouse/$db | awk '{print $8}' |sed '1d' | awk -F ' 阅读全文
posted @ 2022-05-19 16:20 匠人先生 阅读(318) 评论(0) 推荐(0) 编辑
摘要: 背景 在hive sql中执行添加临时udf的操作 add jar hdfs:///user/hive/lib/tools-1.0.jar; create temporary function decode as 'com.test.etl.Decoder'; 在定时任务重偶尔会报错,报错比较随机, 阅读全文
posted @ 2022-05-19 15:11 匠人先生 阅读(353) 评论(0) 推荐(0) 编辑
摘要: 背景 kafka部分进程重启,报错如下: java.io.IOException: Too many open files at sun.nio.ch.ServerSocketChannelImpl.accept(ServerSocketChannelImpl.java:422) at sun.ni 阅读全文
posted @ 2022-05-19 14:41 匠人先生 阅读(697) 评论(0) 推荐(0) 编辑
摘要: 现象 hbase的region server进程大面积重启 排查 第一个重启的region server节点有如下报错: 2021-12-03 14:44:11,948 WARN org.apache.hadoop.hdfs.DFSClient: Failed to connect to /$ser 阅读全文
posted @ 2022-05-19 14:15 匠人先生 阅读(1092) 评论(0) 推荐(0) 编辑
摘要: 背景 某天开始集群网络带宽被占满 登录出问题的节点,通过iftop发现有大量出网方向的流量 hadoop-* ⇒ c-73-29-172-82.hsd1.nj.comcast.net 422Mb 433Mb 236Mb ⇐ 0b 0b 0b hadoop-* ⇒ cpe-75-187-235-200 阅读全文
posted @ 2022-05-19 10:57 匠人先生 阅读(309) 评论(0) 推荐(0) 编辑
摘要: 背景 logstash集群,每个节点服务器配置和任务配置相同,但是其中一个节点发生比较大的消费延迟 定位 观察发现出问题的节点负载比其他节点要低很多,进一步对比logstash进程内线程的情况,发现出问题的节点只有4个worker进程,而正常节点有16个worker进程 进一步排查发现问题节点的lo 阅读全文
posted @ 2022-05-18 17:47 匠人先生 阅读(414) 评论(0) 推荐(0) 编辑
摘要: linux桌面有时会出现蓝牙失效的情况,这时所有蓝牙设备都连接不上,通过重启或者开关蓝牙都无法解决问题,而且设备无法通过删除之后重新添加的方式恢复连接 蓝牙命令行 bluetoothctl 查看状态 rfkill list 发现蓝牙处于block状态 rfkill unblock all 蓝牙恢复 阅读全文
posted @ 2022-05-13 17:28 匠人先生 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 配置 配置1 fs.trash.interval=1440 被删除的文件会进入回收站,默认保留1440分钟后完全删除 配置2 fs.trash.checkpoint.interval=60 回收站checkpoint机制:进入回收站的文件首先进入Current目录,然后定期移动到一个时间戳目录,定期 阅读全文
posted @ 2022-04-06 19:38 匠人先生 阅读(432) 评论(0) 推荐(0) 编辑
摘要: 安装 server端 yum install https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.noarch.rpm -y yum install postgresql 阅读全文
posted @ 2021-09-17 22:08 匠人先生 阅读(147) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 37 下一页