04 2022 档案

摘要:数据如何产生? 使用脚本生成,模拟日志(并非真实的日志) 集群日志生成脚本 #!/bin/bash for i in hadoop102 hadoop103; do echo " i"sshi "cd /opt/module/applog/; java -jar gmall2020-moc 阅读全文
posted @ 2022-04-12 09:59 tootooquan 阅读(182) 评论(0) 推荐(0) 编辑
摘要:Linux的环境变量可在多个文件中配置,如**/etc/profile**,/etc/profile.d/*.sh, ~/.bashrc,~/.bash_profile等,下面说明上述几个文件之间的关系和区别。 bash的运行模式可分为login shell和non-login shell。 例如, 阅读全文
posted @ 2022-04-11 19:42 tootooquan 阅读(33) 评论(0) 推荐(0) 编辑
摘要:数据仓库概念 数据仓库( Data Warehouse ),是为企业制定决策,提供数据支持的。可以帮助企业,改进业务流程、提高产品质量等。 输入数据形式 数据仓库的输入数据通常包括:业务数据、用户行为数据和爬虫数据等。 业务数据(通过Sqoop框架) 各行业在处理事务过程中产生的数据。通常存储在My 阅读全文
posted @ 2022-04-11 19:37 tootooquan 阅读(71) 评论(0) 推荐(0) 编辑
摘要:按从 Z 到 A 的顺序显示结果 字符串默认就是按字典顺序 Z 到 A 的排序:order by cust_name desc 先按XX排序,再按XX排序 先按顾客 ID 对结果进行排序,再按订单日期倒序排列。直接在order by中写多个字段即可。 select cust_id,order_num 阅读全文
posted @ 2022-04-10 11:46 tootooquan 阅读(35) 评论(0) 推荐(0) 编辑
摘要:##根据用户自定义函数类别分为以下三种: (1)UDF(User-Defined-Function) 一进一出 (2)UDAF(User-Defined Aggregation Function) 聚集函数,多进一出 类似于:count/max/min (3)UDTF(User-Defined Ta 阅读全文
posted @ 2022-04-06 14:51 tootooquan 阅读(62) 评论(0) 推荐(0) 编辑
摘要:[root@localhost ~]# ls -ahl total 28K dr-xr-x . 2 root root 135 Dec 16 02:34 . dr-xr-xr-x. 17 root root 224 Dec 14 01:38 .. -rw . 1 root root 1.3K Dec 阅读全文
posted @ 2022-04-05 17:47 tootooquan 阅读(179) 评论(0) 推荐(0) 编辑
摘要:##HashMap HashMap 是一个最常用的Map,它根据键的HashCode值存储数据,根据键可以直接获取它的值,具有很快的访问速度,遍历时,取得数据的顺序是完全随机的,这样会导致按照顺序读取的时候和存入的顺序是不一样的。 ##LinkedHashMap LinkedHashMap 是Has 阅读全文
posted @ 2022-04-05 11:46 tootooquan 阅读(129) 评论(0) 推荐(0) 编辑
摘要:简单记录一下HashSet、List、Array的相互转换方法 array to List Object[] arrays Arrays.asList(arrays); //返回一个固定长度的list,不可add和remove,否则会报java.lang.UnsupportedOperationEx 阅读全文
posted @ 2022-04-01 16:12 tootooquan 阅读(2140) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示