Fork me on GitHub
摘要: 大数据特性 HDFS、YARN、MapReduce三者之间的关系 Hadoop是一个由Apache基金会所开发的分布式系统基础架构,主要解决,海量数据的存储和海量数据的分析计算问题。 海量数据的存储和海量数据的分析计算问题 大数据技术生态体系 推荐系统框架 HDFS读写数据流程 HDFS写数据流程 阅读全文
posted @ 2021-07-19 20:55 薄荷加冰2060 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 关于Hive Hive简介 Hive:由 Facebook 开源用于解决海量结构化日志的数据统计工具。 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并 提供类 SQL 查询功能。 Hive 本质:将 HQL 转化成 MapReduce 程序 (1)Hive 阅读全文
posted @ 2021-07-19 20:00 薄荷加冰2060 阅读(244) 评论(0) 推荐(0) 编辑