string和byte 数组转换的快速方法(采用unsafe)
最近遇到C#中string和byte相互转换的问题,通常的做法,采用下面的方法进行转换:
1. string -> byte[]
byte[] data = System.Text.Encoding.Unicode.GetBytes(var); //var is string
2. byte[] -> string
string var = System.Text.Encoding.Unicode.GetString(data, 0, data.Length); //data is byte[]
注:采用Unicode而不是Default,主要是因为C#中string的存储格式就是Unicode的标准形式,一个字符占用两个字节。当然具体怎么转换取决你的思路,Default采用最节省空间的方式。
这种方法是标准的方法,肯定正确,但是不够快。可以采用unsafe的方法提高效率。具体做法如下:
1. string -> byte[]
fixed (char* str = var) //var is string { fixed (byte* ptr = data) //data is byte[] { byte* bstr = (byte*)str; //---------------------1 for (int i = 0; i < var.Length * 2; i++) { ptr[i++] = bstr[i]; } } }
2. byte[] -> string
char[] tvar = new char[length / 2]; fixed (char* str = tvar) { fixed (byte* ptr = data) { byte* pstr = (byte*)str; //-----------------------2 for (int i = 0; i < data.Length; i++) { pstr[i] = ptr[i]; } } } string var = new string(tvar);
注意:a. 在string中,每个字符占两个字节,所以转换成byte数组时,长度要注意乘以2,反之除以2
b. 在1,2标记中,有一个强制转换成byte字节,这也正是为了方便下面的for语句拷贝,否则一个c#中一个char也是两个字节。
经过测试,对一个简单的中英文混合的字符串转换1000000次,写字符串要快10倍,读字符串大约只快2倍,这是由于最后创建string对象造成的。