byte[]数组的正则表达式搜索 z
在byte[]数组的特定位置进行正则表达式匹配。
为了从硬盘上搜索特定类型的文件,需要根据文件的特征值进行匹配。
对于已掌握文件结构的文件,采用hard-code的方式进行匹配;这样速度快;
对于未掌握文件结构的文件,根据文件的特征数据,使用正则表达式进行匹配。缺点是匹配速度慢。但是相对于阅读或破解每种文件的数据结构,可以节约开发时间。
由于C#中的正则表达式引擎仅提供了对字符串的正则匹配,而我们从硬盘上读取的数据是byte[]类型,所以需要添加对byte[]数据进行正则匹配的支持。
另外,文件的特征值应(否则就很难称之为“特征”了)出现在固定的位置,所有要指定在特定位置进行正则匹配。
using System.Text.RegularExpressions; //byte[]数组Grep搜索,确定在指定offset处是否匹配正则表达式字符串 //buffer:要搜索的byte[]数组 //regex:要匹配的正则表达式字符串 //offset:buffer数组的偏移 public static bool BinaryRegex(byte[] buffer, string regex,int offset) { List<char> charList = new List<char>(); foreach (byte b in buffer) { charList.Add((char)b); } string bString = new String(charList.ToArray()); Match match = Regex.Match(bString,regex); if (match.Success && match.Index == offset) return true; else return false; }