葵恩的学习笔记

导航

随笔分类 -  Hadoop

Hadoop权威指南学习笔记
摘要:一、MapReduce MapReduce是一种线性的可伸缩编程模型,可用于数据处理,程序员要写map和reduce两个函数,函数定义的时从一个键值对集合到另一个键值对集合的映射。数据本地化特性是MapReduce的核心特征。 Hive是基于MapReduce的高级查询语言。 lucence是一个应 阅读全文

posted @ 2021-02-23 11:46 葵恩 阅读(81) 评论(0) 推荐(0)

Hive
摘要:一、引言 Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 1.1.1 优点 1) 操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。 2) 避免了去写Ma 阅读全文

posted @ 2021-02-22 14:45 葵恩 阅读(75) 评论(0) 推荐(0)