HDFS文件块大小

1. HDFS文件块大小
  HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数dfs.blocksize来规定,默认大小在Hadoop2.x/3.x版本中是128M,Hadoop 1.x中是64M


2. 文件块大小的决定因素
  HDFS块的大小设置主要取决于磁盘传输速率。
  寻址时间为传输时间的1%时,则为最佳状态。


3. 为什么块的大小不能设置太小,也不能设置太大
  A. HDFS的块设置太小,会增加寻址时间,程序一直在找块的开始位置
  B. 如果块设置的太大,从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。导致程序在处理这块数据时,会非常慢

 

posted @ 2021-06-02 22:29  shangzq  阅读(700)  评论(0编辑  收藏  举报