摘要: hive—UDF操作 udf的操作过程: 在HIVE会话中add 自定义函数的jar文件,然后创建function,继而使用函数。 下面就以下面课题为例: 课题:统计每个活动的PV和UV 一、Java通过正则表达式,截取标题名称。 以链接,截取标红的字符串。 http://cms.yhd.com/s 阅读全文
posted @ 2016-03-28 23:12 木子小僧 阅读(15637) 评论(0) 推荐(0) 编辑
摘要: 文件的加载,只需要三步就够了,废话不多说,来直接的吧。 一、建表 话不多说,直接开始。 建表,对于日志文件来说,最后有分区,在此案例中,对年月日和小时进行了分区。 建表tracktest_log,分隔符为“\t”部分: 在hive的default库中,建表,建表语句为: 1 create table 阅读全文
posted @ 2016-03-28 18:38 木子小僧 阅读(1151) 评论(0) 推荐(1) 编辑