2017年2月20日
摘要: 数据类型 Hive基本的数据类型: Hive集合数据类型: 另外还有一个复合数据类型,可以综合上面的数据类型组合到一起。 · union: UNIONTYPE<data_type, data_type, ...> 类型说明 时间戳 支持传统的unix时间戳,可选的纳秒级精度。 支持的转换: l 整型 阅读全文
posted @ 2017-02-20 21:07 @ 小浩 阅读(638) 评论(0) 推荐(0) 编辑
摘要: hive文件存储格式包括以下几类: TEXTFILE SEQUENCEFILE RCFILE 自定义格式 其中TEXTFILE为默认格式,建表时不指定默认为这个格式,导入数据时会直接把数据文件拷贝到hdfs上不进行处理。 SequenceFile,RCFile格式的表不能直接从本地文件导入数据,数据 阅读全文
posted @ 2017-02-20 21:04 @ 小浩 阅读(2688) 评论(0) 推荐(0) 编辑
摘要: Hive只支持等值连接,即ON子句中使用等号连接,不支持非等值连接。 Hive内置的数据存储类型,TextFile, SequenceFile, ORC(列式存储) 如果连接语句中有WHERE子句,会先执行JOIN子句,再执行WHERE子句。[吴超1] 假设有以下测试数据 表user数据如下 Use 阅读全文
posted @ 2017-02-20 20:25 @ 小浩 阅读(699) 评论(0) 推荐(0) 编辑
摘要: 一、 控制hive任务中的map数:1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到,该参数不能自定义修 阅读全文
posted @ 2017-02-20 13:02 @ 小浩 阅读(2069) 评论(0) 推荐(0) 编辑
摘要: 对于经常使用qq浏览器的用户可以关注一下~超级使用的功能哦~ http://jingyan.baidu.com/article/a3a3f811f4e0508da2eb8a04.html 阅读全文
posted @ 2017-02-20 10:02 @ 小浩 阅读(319) 评论(0) 推荐(0) 编辑