摘要: 1.查看分区 hive> show partitions table_name; 2.查看分区更新时间 获取hdfs路径 hive> desc formatted table_name; 通过dfs -ls < hdfs path>命令查看数据文件最新更新时间 hive> dfs -ls /user 阅读全文
posted @ 2020-08-05 16:51 独孤风 阅读(4273) 评论(0) 推荐(0) 编辑
摘要: 要求Spark版本2.3以上,亲测2.2无效 配置 config("spark.sql.sources.partitionOverwriteMode","dynamic") 注意 1、saveAsTable方法无效,会全表覆盖写,需要用insertInto,详情见代码 2、insertInto需要主 阅读全文
posted @ 2020-08-05 16:47 独孤风 阅读(3060) 评论(0) 推荐(0) 编辑
摘要: 1,-mkdir 创建目录 Usage:hdfs dfs -mkdir [-p] < paths> 选项:-p 很像Unix mkdir -p,沿路径创建父目录。 2,-ls 查看目录下内容,包括文件名,权限,所有者,大小和修改时间 Usage:hdfs dfs -ls [-R] < args> 选 阅读全文
posted @ 2020-08-05 16:42 独孤风 阅读(4767) 评论(0) 推荐(0) 编辑
摘要: 若hdfs上已经存在文件,要强制覆盖,用 -f 命令 如: hadoop fs -put -f file.name /home/test/ 阅读全文
posted @ 2020-08-05 16:39 独孤风 阅读(2237) 评论(0) 推荐(0) 编辑