摘要: HDFS常用命令 阅读全文
posted @ 2018-11-28 14:44 大数据-大道至简 阅读(442) 评论(0) 推荐(0)
摘要: 找出大文件 磁盘空间被耗尽的时候,免不了要清理一下,比如说/home目录太大,就可以使用下面命令看看到底是谁: 阅读全文
posted @ 2018-11-28 14:42 大数据-大道至简 阅读(555) 评论(0) 推荐(0)
摘要: hive函数 regexp_extract "Hive LanguageManual UDF" 语法描述 Returns the string extracted using the pattern. For example, regexp_extract('foothebar', 'foo(. ? 阅读全文
posted @ 2018-11-28 14:37 大数据-大道至简 阅读(6807) 评论(0) 推荐(0)
摘要: mysql 取整 阅读全文
posted @ 2018-11-28 14:36 大数据-大道至简 阅读(5719) 评论(0) 推荐(1)
摘要: 参考:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF 阅读全文
posted @ 2018-11-28 14:35 大数据-大道至简 阅读(11472) 评论(0) 推荐(0)
摘要: 非分区表 "Blog:hive 非分区表 导入csv数据" 阅读全文
posted @ 2018-11-28 14:33 大数据-大道至简 阅读(477) 评论(0) 推荐(0)
摘要: ``` ## 当前日期和时间 SELECT current_timestamp(); -- 2018-04-28 11:46:03.136 ## 获取当前日期,当前是 2018-04-28 SELECT current_date; OR SELECT current_date(); -- 2018-04-28 ## 获取unix系统下的时间戳 SELECT UNIX_TIMESTAMP(); ... 阅读全文
posted @ 2018-11-28 14:32 大数据-大道至简 阅读(2598) 评论(0) 推荐(1)
摘要: like与rlike的区别 like不是正则,而是通配符。这个通配符可以看一下SQL的标准,例如%代表任意多个字符。 rlike是正则,正则的写法与java一样。'\'需要使用'\\',例如'\w'需要使用'\\w' 阅读全文
posted @ 2018-11-28 14:32 大数据-大道至简 阅读(9079) 评论(0) 推荐(0)
摘要: [TOC] hive参数配置详情可查官方文档 "Hive Configuration+Properties" 本文针对 reducer 调优,主要涉及一下三个参数: hive.exec.reducers.bytes.per.reducer Default Value: 1,000,000,000 p 阅读全文
posted @ 2018-11-28 14:28 大数据-大道至简 阅读(1511) 评论(0) 推荐(0)
摘要: Hive Analytics Functions : row_number rank over(partition by ) ======== 在做数据分析是,会统计用户访问app不同页面的开始时间,理论上同一个用户访问不同页面的开始时间应该不同。为了排查app端是否存在bug,用到row_numb 阅读全文
posted @ 2018-11-28 14:27 大数据-大道至简 阅读(194) 评论(0) 推荐(0)
知识共享许可协议
本作品采用知识共享署名-非商业性使用-禁止演绎 3.0 未本地化版本许可协议进行许可。