文件概述
我们这里讨论的文件并不是文件夹中的纸质文件,特指计算机中的文件。
那计算机中的文件到底是什么呢?
什么是文件
计算机文件是存储在存储器上的数据序列,可以包含任何数据内容。
概念上,文件是数据的集合和抽象。用文件的形式组织和表达数据更灵活和有效。
文件包括两种类型:
- 文本文件
- 二进制文件
文件本质上都是存储在存储器上的二进制数据。
使用HexEditor可以以二进制的方式打开任何文件。
特别的文本文件遵循统一的字符编码,在打开时,计算机会根据字符编码解析成编码表上对应的字符。
二进制文件和文本文件本质上没有区别,只是没有统一的编码,需要根据特定的程序进行解析和运行。
信息量
计算机只能识别0
和1
,也即是我们常说的二进制,任何信息也是通过0
和1
来表达。
信息的最小单位叫bit
,它可以表达一位二进制数,也即是可以表达2种情况,0
或1
。
8bit
叫做1个Byte
(字节),一个字节可以表示2的8次方种情况,即256种。
计算机中的存储单元,例如内存,硬盘等都是使用Byte作为最小单位,接下来的单位大家估计耳熟能详。
- 1024Byte = 1KB
- 1024KB = 1MB
- 1024MB = 1GB
- 1024GB = 1TB
所有的信息都是转换成二进制数据存储在电脑中,再按照信息占据的字节数来计算衡量大小。
例如,0-255的整数使用一个字节就可以表示和存储。
整数天然的可以转换为二进制的信息,其他的信息需要通过各种方法进行转换。