04 2022 档案
摘要:数据如何产生? 使用脚本生成,模拟日志(并非真实的日志) 集群日志生成脚本 #!/bin/bash for i in hadoop102 hadoop103; do echo " i "cd /opt/module/applog/; java -jar gmall2020-moc
阅读全文
摘要:Linux的环境变量可在多个文件中配置,如**/etc/profile**,/etc/profile.d/*.sh, ~/.bashrc,~/.bash_profile等,下面说明上述几个文件之间的关系和区别。 bash的运行模式可分为login shell和non-login shell。 例如,
阅读全文
摘要:数据仓库概念 数据仓库( Data Warehouse ),是为企业制定决策,提供数据支持的。可以帮助企业,改进业务流程、提高产品质量等。 输入数据形式 数据仓库的输入数据通常包括:业务数据、用户行为数据和爬虫数据等。 业务数据(通过Sqoop框架) 各行业在处理事务过程中产生的数据。通常存储在My
阅读全文
摘要:按从 Z 到 A 的顺序显示结果 字符串默认就是按字典顺序 Z 到 A 的排序:order by cust_name desc 先按XX排序,再按XX排序 先按顾客 ID 对结果进行排序,再按订单日期倒序排列。直接在order by中写多个字段即可。 select cust_id,order_num
阅读全文
摘要:##根据用户自定义函数类别分为以下三种: (1)UDF(User-Defined-Function) 一进一出 (2)UDAF(User-Defined Aggregation Function) 聚集函数,多进一出 类似于:count/max/min (3)UDTF(User-Defined Ta
阅读全文
摘要:[root@localhost ~]# ls -ahl total 28K dr-xr-x . 2 root root 135 Dec 16 02:34 . dr-xr-xr-x. 17 root root 224 Dec 14 01:38 .. -rw . 1 root root 1.3K Dec
阅读全文
摘要:##HashMap HashMap 是一个最常用的Map,它根据键的HashCode值存储数据,根据键可以直接获取它的值,具有很快的访问速度,遍历时,取得数据的顺序是完全随机的,这样会导致按照顺序读取的时候和存入的顺序是不一样的。 ##LinkedHashMap LinkedHashMap 是Has
阅读全文
摘要:简单记录一下HashSet、List、Array的相互转换方法 array to List Object[] arrays Arrays.asList(arrays); //返回一个固定长度的list,不可add和remove,否则会报java.lang.UnsupportedOperationEx
阅读全文