linux du与ls查看文件大小时的区别
du和ls查看文件大小的区别
du == disk usage (磁盘使用量,占用的磁盘空间)
du 的基本使用
du -s #s参数是可以统计占硬盘空间大小的
如 du -skh web
-k或--kilobytes 以1024 bytes为单位。
-h或--human-readable 以K,M,G为单位,提高信息的可读性
-s或--summarize 统计目录或文件
一个文件占用的磁盘空间和一个文件的大小是两码事情。占用空间取决于文件系统的块(block)的大小,linux一般默认是4k(4096) ,因此,一个大小为1个字节的文件,最小也要占用4k,如果你创建文件系统的时候制定块大小是16K,那么即便一个文件只有1个字节,占用空间也是16K。
如果一个分区上主要放大文件,那么block可以大一些,有利于减少磁盘碎片,如果主要放小文件,那么block设置小一下,否则太浪费磁盘空间。
通常情况下,ls 显示的文件大小比du显示的磁盘占用空间小
原因:
比如文件系统的block是4K,一个13K的文件占用的空间是 13k/4k = 3.25 个block,一个block只能被一个文件占用,因此实际占用空间就是4个block,就是16K。
如果一个文件有比较大的黑洞,那么会出现文件大小比磁盘空间占用大的情况
原因:
首先要理解什么是黑洞,怎么才能产生黑洞?(以下来自《UNIX 环境高级编程》)
在向一个文件中写数据的时候,文件偏移量可以大于文件的当前长度,在这种情况下,对该文件的下一次写将加长该文件,并在文件中构成一个空洞,这一定是允许的。位于文件中但没有写过的字节都被读为0.
文件中的空洞并不要求在磁盘上占用存储区。具体处理方式与文件系统的实现有关,当定位超出文件尾端之后写时,对于新写的数据需要分配磁盘块,但是对于原文件尾端和新开始写位置之间的部分则不需要分配磁盘块。
du 的基本使用
du -s #s参数是可以统计占硬盘空间大小的
如 du -skh web
-k或--kilobytes 以1024 bytes为单位。
-h或--human-readable 以K,M,G为单位,提高信息的可读性
-s或--summarize 统计目录或文件
一个文件占用的磁盘空间和一个文件的大小是两码事情。占用空间取决于文件系统的块(block)的大小,linux一般默认是4k(4096) ,因此,一个大小为1个字节的文件,最小也要占用4k,如果你创建文件系统的时候制定块大小是16K,那么即便一个文件只有1个字节,占用空间也是16K。
如果一个分区上主要放大文件,那么block可以大一些,有利于减少磁盘碎片,如果主要放小文件,那么block设置小一下,否则太浪费磁盘空间。
通常情况下,ls 显示的文件大小比du显示的磁盘占用空间小
原因:
比如文件系统的block是4K,一个13K的文件占用的空间是 13k/4k = 3.25 个block,一个block只能被一个文件占用,因此实际占用空间就是4个block,就是16K。
如果一个文件有比较大的黑洞,那么会出现文件大小比磁盘空间占用大的情况
原因:
首先要理解什么是黑洞,怎么才能产生黑洞?(以下来自《UNIX 环境高级编程》)
在向一个文件中写数据的时候,文件偏移量可以大于文件的当前长度,在这种情况下,对该文件的下一次写将加长该文件,并在文件中构成一个空洞,这一定是允许的。位于文件中但没有写过的字节都被读为0.
文件中的空洞并不要求在磁盘上占用存储区。具体处理方式与文件系统的实现有关,当定位超出文件尾端之后写时,对于新写的数据需要分配磁盘块,但是对于原文件尾端和新开始写位置之间的部分则不需要分配磁盘块。
例如:用dd if=/dev/zero of=a.out seek=1023 bs=1M count=1创建a.out文件后,用ls查看a.out的文件大小为1G,用du查看a.out文件大小为1M。
生成黑洞文件的示例代码temp.c:
#include
#include
#include
#define FILE_MODE (S_IRUSR | S_IWUSR | S_IRGRP | S_IROTH)
char buf1[] = "abcdefghij";
char buf2[] = "ABCDEFGHIJ";
void err_sys(char *msg){
printf("%s", msg);
exit(0);
}
int main(void){
int fd;
if((fd = creat("file.hole", FILE_MODE)) < 0)
err_sys("creat error");
if(write(fd, buf1, 10) != 10)
err_sys("buf1 write error");
if(lseek(fd, 16384, SEEK_SET) == -1)
err_sys("lseek error");
if(write(fd, buf2, 10) != 10)
err_sys("buf2 write error");
exit(0);
}
$gcc temp.c
$./a.out
$od -c file.hole
0000000 a b c d e f g h i j \0 \0 \0 \0 \0 \0
0000020 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0
*
0040000 A B C D E F G H I J
0040012
$du -sh file.hole
8.0K file.hole
$ls -al
drwxr-xr-x 2 root root 4096 Apr 15 20:20 .
drwxr-xr-x 8 root root 4096 Mar 20 13:22 ..
-rwxr-xr-x 1 root root 5598 Apr 15 20:20 a.out
-rw-r--r-- 1 root root 16394 Apr 15 20:20 file.hole
-rw-r--r-- 1 root root 718 Apr 15 20:20 temp.c