摘要: Hadoop是一个开源的可运行于大规模集群上的分布式文件系统和运算处理基础框架;擅长于在廉价机器搭建的群集上进行海量数据的存储与离线处理 Hadoop能帮我们做什么?分布式 多节点协作;其核心组件:HDFS block dataNode 学习要求:Linux系统基本操作 Java开发 Hadoop核 阅读全文
posted @ 2019-03-15 08:25 geryhz 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 大数据概念的体现: 1 数据量(Volume)存储量大;计算量大 2 数据多样性(Variety)数据来源多;格式多 3 快速(Velocity)增长速度快,处理速度要求快 高缓冲 高并发 4 价值(Value)浪里淘沙却又弥足珍贵 大数据应用场景:电商 搜索 微博 物联网 移动设备 运营商 科研领 阅读全文
posted @ 2019-03-15 08:11 geryhz 阅读(91) 评论(0) 推荐(0) 编辑