byte[]数组的正则表达式搜索 z

在byte[]数组的特定位置进行正则表达式匹配。

为了从硬盘上搜索特定类型的文件,需要根据文件的特征值进行匹配。

对于已掌握文件结构的文件,采用hard-code的方式进行匹配;这样速度快;

对于未掌握文件结构的文件,根据文件的特征数据,使用正则表达式进行匹配。缺点是匹配速度慢。但是相对于阅读或破解每种文件的数据结构,可以节约开发时间。

由于C#中的正则表达式引擎仅提供了对字符串的正则匹配,而我们从硬盘上读取的数据是byte[]类型,所以需要添加对byte[]数据进行正则匹配的支持。

另外,文件的特征值应(否则就很难称之为“特征”了)出现在固定的位置,所有要指定在特定位置进行正则匹配。

using System.Text.RegularExpressions;        

//byte[]数组Grep搜索,确定在指定offset处是否匹配正则表达式字符串
//buffer:要搜索的byte[]数组
//regex:要匹配的正则表达式字符串
//offset:buffer数组的偏移
        public static bool BinaryRegex(byte[] buffer, string regex,int offset)
        {
            List<char> charList = new List<char>();
            foreach (byte b in buffer)
            {
                charList.Add((char)b);
            }
            string bString = new String(charList.ToArray());
            Match match = Regex.Match(bString,regex);
            if (match.Success && match.Index == offset)
                return true;
            else return false;
        }

 

posted on 2018-05-03 08:10  武胜-阿伟  阅读(1287)  评论(0编辑  收藏  举报