以上列表中的文件并不是来自于某个文件夹中的所有jpg文件,而是来自于
这个文件。
将多个文件合并为一个文件在许多应用领域都十分有用。亲自实现这样一个程序一定不但过瘾且在许多时候可以帮助我们构建更高效的程序。这里我做了一个方案例分享给大家。
由于合并后的文件就像一个包裹,所以下文中都把这样的文件称为“包文件”
主构思:
要把多个文件合并成一个包文件,还要可以区分其中的某个文件并提取出来。我们需要知道文件的名称和这个文件在包文件中的位置及长度,也就是所谓的地址偏移。
由于包文件常常会比较大,所以不应该让它的内容常驻于内存,只应该需要某部分的时候再从包文件中提取。
我是这样做的:
一个管理器类,提供一些外围的方法
_pathList用于存放要添加到包文件的文件路径,通过调用AddSourceFile()方法添加
_pf 是具体的包文件,通过LoadPackFile() 生成实例,通过CurrentPackFile属性返回
Build方法用于生成包文件
PackFile类作为PackFileManager的嵌套类,它提供包文件的属性和施工细节。
好了,我们先来看看PackFileManager.Build()方法
public void Build(string path)
{
using (FileStream fs = new FileStream(path, FileMode.Create, FileAccess.Write))
{
BinaryWriter bw = new BinaryWriter(fs);
bw.Write("PackFile");
bw.Write(this._pathList.Count);
foreach (string f in this._pathList)
{
FileInfo fi = new FileInfo(f);
bw.Write(fi.Length);
fi = null;
}
foreach (string f in this._pathList)
{
bw.Write(Path.GetFileName(f));
}
foreach (string f in this._pathList)
{
bw.Write(File.ReadAllBytes(f));
bw.Flush();
}
}
}
1. 先写个“PackFile”字符串到文件头
2. 把以Int32为类型的,要输出到包文件中的文件数量写入
3. 把以long为类型的,要输出到包文件中的每个文件的长度写入。
4. 再把每个文件名写入
5. 最后写入每个文件的实体内容。
由于在写或读时不频繁在Write方法或ReadXXX方法的不同版本间频繁切换,所以我想这样组织文件结构可以更高效一些。
疑问来了。在写入文件名的时候,我们使用bw.Write(Path.GetFileName(f));
调用了BinaryWriter.Write(string value),传入的是字符串,那么在读取的时候要调用BinaryReader.ReadString()。这时它是如何区分两个字符串边界的。还好,Write方法会先将字符串长度作为一个四字节无符号整数写入,于是在用BinaryReader.ReadString()的时候它会根据这个值来读取特定长度的值,并理解为字符串。
这里列出几个重要方法:
PackFileManager的LoadPackFile方法
public void LoadPackFile(string path)
{
if (!File.Exists(path))
{
throw new FileNotFoundException(path);
}
if (_pf != null)
{
_pf.Close();
_pf = null;
}
FileStream fs = new FileStream(path, FileMode.Open, FileAccess.Read);
BinaryReader br = new BinaryReader(fs);
if (br.ReadString() != "PackFile")
{
throw new InvalidCoalescentFileException("该文件不是有效的包文件");
}
this._pf = new PackFile(fs,br);
}
此时,我们在生成时写入的字符串"PackFile" 就有了明确的功能
PackFile的构造函数
internal PackFile(FileStream srcFile,BinaryReader br)
{
this._sourceFile = srcFile;
_br = br;
this._fileCount = _br.ReadInt32();//取文件数
for (int i = 1; i <= _fileCount; i++)
{
this._fileLengthList.Add(_br.ReadInt64());
}
for (int i = 1; i <= _fileCount; i++)
{
this._shortNameList.Add(_br.ReadString());
}
this._contentStartPos = _sourceFile.Position;//设置实体文件总起始位置
}
PackFile.GetBytes()
public byte[] GetBytes(int index)
{
long startPos = this._contentStartPos;
for (int i = 0; i < index; i++)
{
startPos += this._fileLengthList[i];
}
_sourceFile.Position = startPos; //设置某文件内容的起始位置
return _br.ReadBytes((int)_fileLengthList[index]);
}
这只是一个草案,我们还可以加入压缩、或是像ZIP文件那样的嵌套文件夹功能,改进后的代码别忘与我分享哦。
代码下载:测试并合文件
我们来总结一下:
纵观代码可以发现,核心功能都在围绕“偏移位置”与“长度”两个概念,这在数据结构中很重要。同时,这也提醒了我们为什么在数据库表字段中,作为主键的只能是“定长”类型,而不能是“变长”类型。