摘要:
HDFS常用命令 阅读全文
posted @ 2018-11-28 14:44
大数据-大道至简
阅读(442)
评论(0)
推荐(0)
摘要:
找出大文件 磁盘空间被耗尽的时候,免不了要清理一下,比如说/home目录太大,就可以使用下面命令看看到底是谁: 阅读全文
posted @ 2018-11-28 14:42
大数据-大道至简
阅读(555)
评论(0)
推荐(0)
摘要:
hive函数 regexp_extract "Hive LanguageManual UDF" 语法描述 Returns the string extracted using the pattern. For example, regexp_extract('foothebar', 'foo(. ? 阅读全文
posted @ 2018-11-28 14:37
大数据-大道至简
阅读(6807)
评论(0)
推荐(0)
摘要:
mysql 取整 阅读全文
posted @ 2018-11-28 14:36
大数据-大道至简
阅读(5719)
评论(0)
推荐(1)
摘要:
参考:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF 阅读全文
posted @ 2018-11-28 14:35
大数据-大道至简
阅读(11472)
评论(0)
推荐(0)
摘要:
非分区表 "Blog:hive 非分区表 导入csv数据" 阅读全文
posted @ 2018-11-28 14:33
大数据-大道至简
阅读(477)
评论(0)
推荐(0)
摘要:
```
## 当前日期和时间
SELECT current_timestamp();
-- 2018-04-28 11:46:03.136 ## 获取当前日期,当前是 2018-04-28
SELECT current_date;
OR
SELECT current_date();
-- 2018-04-28 ## 获取unix系统下的时间戳
SELECT UNIX_TIMESTAMP();
... 阅读全文
posted @ 2018-11-28 14:32
大数据-大道至简
阅读(2598)
评论(0)
推荐(1)
摘要:
like与rlike的区别 like不是正则,而是通配符。这个通配符可以看一下SQL的标准,例如%代表任意多个字符。 rlike是正则,正则的写法与java一样。'\'需要使用'\\',例如'\w'需要使用'\\w' 阅读全文
posted @ 2018-11-28 14:32
大数据-大道至简
阅读(9079)
评论(0)
推荐(0)
摘要:
[TOC] hive参数配置详情可查官方文档 "Hive Configuration+Properties" 本文针对 reducer 调优,主要涉及一下三个参数: hive.exec.reducers.bytes.per.reducer Default Value: 1,000,000,000 p 阅读全文
posted @ 2018-11-28 14:28
大数据-大道至简
阅读(1511)
评论(0)
推荐(0)
摘要:
Hive Analytics Functions : row_number rank over(partition by ) ======== 在做数据分析是,会统计用户访问app不同页面的开始时间,理论上同一个用户访问不同页面的开始时间应该不同。为了排查app端是否存在bug,用到row_numb 阅读全文
posted @ 2018-11-28 14:27
大数据-大道至简
阅读(194)
评论(0)
推荐(0)