10 2023 档案

摘要:datax中没有提供给用户自定义null值到hdfs文件的存储格式,hdfs writer会将null值存储为空字符串('') 而hive默认存储格式为\N,后期将DataX同步的文件导入Hive表就会出现问题 解决方法: 1.修改源码(推荐):参考http://t.csdnimg.cn/BWGRK 阅读全文
posted @ 2023-10-07 14:54 sunshin1 阅读(235) 评论(0) 推荐(0) 编辑
摘要:问题描述: 我在构建一个新的数仓时使用maxwell,发现maxwell启动一会儿就挂了,或者是根本启动不了 查看日志说是没有我监控的数据库(Couldn't find database xxxx),但检查发现目标数据库在mysql中存在,核对大小写问题,无误 解决: 思路:想到这个maxwell是 阅读全文
posted @ 2023-10-07 00:17 sunshin1 阅读(252) 评论(0) 推荐(0) 编辑
摘要://groupBy def wordCount1(sc:SparkContext) = { val rdd = sc.makeRDD(List("hello scala","hello spark")) val words: RDD[String] = rdd.flatMap(_.split(" " 阅读全文
posted @ 2023-10-03 00:28 sunshin1 阅读(72) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示