2022年2月5日
摘要: 写在前面ps:干货很多…我们都知道,Hive基本上就是内部表和外部表两种类型,在面试的时候,常会问到这种题目:1.hive内部表和外部表的区别2.什么时候使用内部表,什么时候使用外部表 来自官网的定义: Managed tablesA managed table is stored under th 阅读全文
posted @ 2022-02-05 18:23 该用户很懒 阅读(835) 评论(0) 推荐(0) 编辑
摘要: 1、安装pyspark 2、下载想要的hadoop版本,解决 missing WINUTILS.EXE 的问题 下载地址:https://github.com/steveloughran/winutils 比如,我保存的本地地址在这 3、pyspark程序中指定系统变量 from pyspark i 阅读全文
posted @ 2022-02-05 15:28 该用户很懒 阅读(692) 评论(0) 推荐(1) 编辑