会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
浪花98
博客园
首页
新随笔
联系
管理
订阅
2019年9月8日
大数据项目——互联网精准营销——数据清洗
摘要: 使用kettle进行数据清洗: 1.新建转换去除手机销售信息表的重复记录 要求:去除该字段中的所有空格,方便后续聚合统计,字母统一大小写,去除该字段中的所有特殊字符(各种标点符号) 这里可选用排序加去重组件,也可用哈希去重。然后用字符串操作去括号,大小写统一。字符串替换的正则表达式去除特殊字符。 2
阅读全文
posted @ 2019-09-08 08:28 浪花98
阅读(358)
评论(0)
推荐(0)
编辑
公告