摘要: 使用kettle进行数据清洗: 1.新建转换去除手机销售信息表的重复记录 要求:去除该字段中的所有空格,方便后续聚合统计,字母统一大小写,去除该字段中的所有特殊字符(各种标点符号) 这里可选用排序加去重组件,也可用哈希去重。然后用字符串操作去括号,大小写统一。字符串替换的正则表达式去除特殊字符。 2 阅读全文
posted @ 2019-09-08 08:28 浪花98 阅读(358) 评论(0) 推荐(0) 编辑