上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 18 下一页
摘要: Hive设置配置参数的方法 Hive提供三种可以改变环境变量的方法,分别是: (1)、修改${HIVE_HOME}/conf/hive-site.xml配置文件; (2)、命令行参数; (3)、在已经进入cli时进行参数声明。 方法一:hive-site.xml配置参数 在Hive中,所有的默认配置 阅读全文
posted @ 2019-12-14 14:57 玩转大数据 阅读(4485) 评论(0) 推荐(0) 编辑
摘要: UDF User-Defined-Function 自定义函数 、一进一出; 背景 系统内置函数无法解决实际的业务问题,需要开发者自己编写函数实现自身的业务实现诉求。 应用场景非常多,面临的业务不同导致个性化实现很多,故udf很需要。 意义 函数扩展得到解决,极大丰富了可定制化的业务需求。 IO要求 阅读全文
posted @ 2019-12-14 14:56 玩转大数据 阅读(8744) 评论(0) 推荐(0) 编辑
摘要: 聚合函数 函数处理的数据粒度为多条记录。 sum()—求和 count()—求数据量 avg()—求平均直 distinct—求不同值数 min—求最小值 max—求最人值 分析函数 Analytics functions RANK ROW_NUMBER DENSE_RANK CUME_DIST P 阅读全文
posted @ 2019-12-14 14:55 玩转大数据 阅读(1150) 评论(0) 推荐(0) 编辑
摘要: 1-创建表 -- 内部表 create table aa(col1 string,col2 int) partitioned by(statdate int) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; -- 外部表 create external 阅读全文
posted @ 2019-12-14 14:54 玩转大数据 阅读(655) 评论(0) 推荐(0) 编辑
摘要: Hive视图特点 View是逻辑存在,Hive暂不支持物化视图(1.0.3) View只读,不支持LOAD/INSERT/ALTER。需要改变View定义,可以是用Alter View View内可能包含ORDER BY/LIMIT语句,假如一个针对view的查询也包含这些语句, 则view中的语句 阅读全文
posted @ 2019-12-14 14:52 玩转大数据 阅读(10306) 评论(0) 推荐(1) 编辑
摘要: Hive内外部区分方法 查看hive元数据:进入mysql中hive元数据库,查看TBLS表,查看对应的表名和表类型; 在hive-cli界面:desc extended tablename,查看TableType,一般在展示结果的最后显示; 在hive-cli界面:desc formatted t 阅读全文
posted @ 2019-12-14 14:51 玩转大数据 阅读(1366) 评论(0) 推荐(0) 编辑
摘要: Hive中的文件格式 1-TEXTFILE 文本格式,Hive的默认格式,数据不压缩,磁盘开销大、数据解析开销大。 对应的hive API为:org.apache.hadoop.mapred.TextInputFormat和org.apache.hive.ql.io.HiveIgnoreKeyTex 阅读全文
posted @ 2019-12-14 14:50 玩转大数据 阅读(4997) 评论(0) 推荐(0) 编辑
摘要: Hive的数据模型 Hive数据模型.png 数据模型组成及应用场景 Hive的数据模型主要有:database、table、partition、bucket四部分; 数据模型之database database:相当于关系型数据库中的命名空间,作用是将数据库应用隔离到不同的数据库模式中,hive提 阅读全文
posted @ 2019-12-14 14:49 玩转大数据 阅读(1584) 评论(0) 推荐(0) 编辑
摘要: 什么是Hive Hive是由Facebook开源用于解决海量结构化日志的数据统计;Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射 成一张表,并提供类SQL查询功能,底层计算引擎默认为Hadoop的MapReduce(本质是将sql转化成mapreduce程序),可以将引擎更 阅读全文
posted @ 2019-12-14 14:47 玩转大数据 阅读(518) 评论(0) 推荐(0) 编辑
摘要: 从使用方面讲 Hive是一个构建在Hadoop平台上的数据仓库,可以将结构化的数据文件映射为一张数据库表。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化成Map/Reduce。 HBase 是基于HDFS平台的Key/Value类型的NoSql 阅读全文
posted @ 2019-12-14 14:45 玩转大数据 阅读(1011) 评论(0) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 18 下一页