摘要: Linux 1.HDFS 分布式文件系统 2.MapReduce并行计算框架 3.Hive 数据仓库 sqoop 数据集成工具HDFS<->RDBMS 5.用户行为分析项目 大数据产生的三个助推力 1.互联网产生的非结构化数据(TB PB以上) 2.传统名数据库在处理海量非结构化数据产生的瓶颈 3. 阅读全文
posted @ 2020-06-17 17:31 ZC_Wang 阅读(110) 评论(0) 推荐(0) 编辑