摘要: 一、大数据的基本处理步骤1)数据获取 flume 数据来源:专业数据机构,国家统计局,企业内部数据,互联网数据2)数据清洗 mapreduce 清除不需要,错误,无效的数据3)数据存储 hdfs 性能,可用,可靠,成本等方面考量4)数据处理 hive 按业务需求处理5)数据分享 sqoop,kett 阅读全文
posted @ 2019-06-19 10:37 跳刀不跳 阅读(449) 评论(0) 推荐(0) 编辑