hive:基于hadoop的一个数据仓库工具(离线),可以将结构化的数据文件映射成为一张数据库表,并提供sql查询功能
hive里面的表的字段对应文件里的一些数据字段,解析sql语法,组装成一个mapreduce job到yarn运行,在到hdfs里面查找
会sql即可