摘要:
获取当前日期 SELECT CURRENT_DATE, CURRENT_TIMESTAMP, from_unixtime(unix_timestamp()); 上个月1号 concat(substr(date_sub('${bizdate}',1),1,7),'-01') 上个月最后一天 date_ 阅读全文
摘要:
获取当前日期 SELECT CURRENT_DATE, CURRENT_TIMESTAMP, from_unixtime(unix_timestamp()); 上个月1号 concat(substr(date_sub('${bizdate}',1),1,7),'-01') 上个月最后一天 date_ 阅读全文
摘要:
1. 梳理出你要的列和行维度 列维度: 每一周 行维度: 年级 + 学科 + 班型 2. 对数据按周增序进行聚合 (即根据列维度) ,生成list concat_ws 和 collect_list (collect_set 会去重后再聚合) 顺序随机 sort_array 只能增序,要倒序排的话在子 阅读全文
摘要:
https://www.cnblogs.com/Zhi-Z/p/8728168.html 阅读全文
摘要:
1.如何获取中文字符串的首字母 2. 判断文件夹是否存在, 存在删除,不存在创建 阅读全文
摘要:
1. 修改全部列名 df.columns 2. 修改指定列名 df.rename 阅读全文
摘要:
1. 数据样本 2. format 把cust_per打印成百分值输出 iloc取指定位置的元素 3. 把打印出来的百分值拼接起来 4. 调整图例和图的位置 5. 保存 matlibplot.plot 画出来的图 阅读全文
摘要:
目前搜到的是,下载一个字体到程序路径,设置成默认字体。 https://blog.csdn.net/irene_loong/article/details/68955485 阅读全文
摘要:
1. 查看各库的存储大小 hdfs dfs -du -h /user/hive/warehouse 2. 删除HDFS 文件 hdfs dfs -rmr 绝对路径名 例如:hdfs dfs -rmr /user/hive/warehouse/xhx_dw.db/dw_homework_questio 阅读全文
摘要:
1 MySQL 到 Hive 表的sqoop任务把 原本的NULL 变成字符串 ‘null’ 了 alter table ${table_name} SET SERDEPROPERTIES('serialization.null.format' = '\\N'); -- 修改表的NULL值属性 sq 阅读全文
摘要:
1. 集群任务队列: 一般有 root.default, root.online, root.offline, root.spark-thiftserver Hue提交的任务一般默认在 default队列 如果是紧急任务,可以提交到其他队列,会快很多 方法: 指定队列 set mapreduce.j 阅读全文
|