QueryMarsBo

2018年7月13日

摘要：注：Hive面试题：累积报表数据文件：有如下访客访问次数统计表 t_access_times 需要输出报表：t_access_times_accumulate 实现步骤：创建表，并将数据加载到表中： 1、第一步，先求每个用户的月总金额 2、第二步，将月总金额表自己连接自己 3、第三步，从上一阅读全文

posted @ 2018-07-13 10:07 QueryMarsBo 阅读(596) 评论(0) 推荐(0)

2018年7月12日

11_Hive TransForm 案例

摘要： 1.需求：将Json格式的数据处理后插入新表中数据文件如下：rating.json，文件格式：{"movie":"2858","rate":"5","timeStamp":"978159467","uid":"17"} 实现步骤： 1.使用Hive创建原始表rate_json,并将rating.j 阅读全文

posted @ 2018-07-12 16:10 QueryMarsBo 阅读(258) 评论(0) 推荐(0)

2018年7月11日

10_Hive自定义函数UDF

摘要： Hive官方的UDF手册地址是：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF 1.使用内置函数的快捷方法：创建一个表dual，load数据到dual表，然后尝试内置函数 1.Hive自定义函数：当Hive提阅读全文

posted @ 2018-07-11 14:13 QueryMarsBo 阅读(360) 评论(0) 推荐(0)

09_用户行为分析_广告精准推送项目介绍

摘要： 1.用户行为分析用户行为分析，是指在获得网站访问量基本数据的情况下，对有关数据进行统计、分析，从中发现用户访问网站的规律，并将这些规律与网络营销策略等相结合，从而发现目前网络营销活动中可能存在的问题，并为进一步修正或重新制定网络营销策略提供依据。这是狭义的只指网络上的用户行为分析意义:通过对阅读全文

posted @ 2018-07-11 11:12 QueryMarsBo 阅读(337) 评论(0) 推荐(0)

2018年7月10日

08_Hive中的各种Join操作

摘要： 1.关于hive中的各种join Hive中有许多的Join操作，例如：LEFT、RIGHT和FULL OUTER JOIN，INNER JOIN，LEFT SEMI JOIN等； 1.1.准备两组数据： 1.2.在Hive中建表： 1.3.在Hive表中导入数据： 1.4.inner join内连阅读全文

posted @ 2018-07-10 12:00 QueryMarsBo 阅读(322) 评论(0) 推荐(0)

07_Hive的基本命令_Insert命令

摘要： 1.将查询结果插入Hive表语法结构: 1.1.基本模式插入: INSERT OVERWRITE TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement1 FROM from_statement 阅读全文

posted @ 2018-07-10 11:46 QueryMarsBo 阅读(14214) 评论(1) 推荐(1)

2018年7月9日

06_Hive分桶机制及其作用

摘要： 1.Clustered By 对于每一个表（table）或者分区， Hive可以进一步组织成桶，也就是说桶是更为细粒度的数据范围划分。 Hive也是针对某一列进行桶的组织。Hive采用对列值哈希，然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中。把表（或者分区）组织成桶（Bucket）有两阅读全文

posted @ 2018-07-09 15:19 QueryMarsBo 阅读(1327) 评论(1) 推荐(1)

05_Hive分区总结

摘要： 2.1.创建分区表并将本地文件的数据加载到分区表：使用下面的命令来创建一个带分区的表通过partitioned by(country string)关键字声明该表是分区表，且分区字段不能为create table时存在的字段。此时只能说指定了这个表会分区，但是具体数据有哪些分区则会在导入数据时阅读全文

posted @ 2018-07-09 14:49 QueryMarsBo 阅读(1731) 评论(0) 推荐(1)

2018年7月6日

04_Hive的基本命令

摘要： 1.Hive基本操作： 1.1.Hive的建表语句：参数说明： CREATE TABLE：创建一个指定名字的表。如果相同名字的表已经存在，则抛出异常；用户可以用 IF NOT EXISTS 选项来忽略这个异常 EXTERNAL：关键字可以让用户创建一个外部表，在建表的同时指定一个指向实际数据的路径阅读全文

posted @ 2018-07-06 16:08 QueryMarsBo 阅读(271) 评论(0) 推荐(0)

03_Hive的交互方式

摘要：之前使用的Shell方式只是Hive交互方式中的一种，还有一种就是将Hive启动为服务运行在一个节点上，那么剩下的节点就可以使用客户端来连接它，从而也可以使用Hive的数据分析服务 1.Hive的交互方式： (1) Hive交互shell：/usr/local/src/hive-1.2.1/bin 阅读全文

posted @ 2018-07-06 15:56 QueryMarsBo 阅读(176) 评论(0) 推荐(0)

公告