摘要:
最近使用实验楼撸代码 http://www.shiyanlou.com/register?inviter=NTY0MzE5NDE2NjM5 做一道count and say 的算法题的时候,有c++语法的解题答案,我改成用python 题目: 在用python写的时候 我用了for中有while循环 阅读全文
摘要:
1.由于之前比较熟悉hive,于是用spark.sql写,其中包含hive的一些函数,如 数据转换后的形式: 2.因此用spark实现这两种变化的方法如下: 阅读全文
摘要:
1.建立hive表如下: 2.插入数据 867463027018201 2006 2017012420 5.2.4 mi_4lte android_4.4.48516c9ebd4073a5281e74ecbf2af6297e159b98d 4002 2017012420 5.4.1 iphone8_ 阅读全文
摘要:
1.打包过程发现错误如下: 首先快速在没有运行完前,查看log中报错: Unsupported major.minor version 52.0 2 原因:是scala的jre和java的jdk不匹配,需要将idea中的scala版本有默认版本改为合适的对应版本,对应版本需要自己下载,下载镜像安装包 阅读全文
摘要:
1.使用COALESCE时,用到group by with cube,如果之前两个表left join时,有数据为null,就会使得查出的数据主键不唯一 例如: 得到的数据会出现两组key一样但数据不一样的情况: 说明其中第二个数据是a表中没有匹配到souform的空值 阅读全文
摘要:
1.建立hive的外部表匹配hdfs上的数据 出现如下报错: 再来看一下这个表的结构: 可以发现这个表没有建立分区,但是在hdfs上是有分区的: 解决方法是删除这个分区目录,就可以匹配数据了: 2.hive建立有分区的外部表时,发现没有数据 有可能是因为没有加partition,加partiiton 阅读全文