spark小文件过多如何解决
参考https://www.cnblogs.com/flymin/p/11345646.html
小文件:存储于HDFS中小文件,即指文件的大小远小于HDFS上块(dfs.block.size)大小的文件。
-----------专注于实时数仓,大数据存储、计算
参考https://www.cnblogs.com/flymin/p/11345646.html
小文件:存储于HDFS中小文件,即指文件的大小远小于HDFS上块(dfs.block.size)大小的文件。