按照字节截取字符串
C#中substring默认是将汉字当一个字节来截取的,但是我需要把汉字按照2个字节来算。
如果String str = "买价1,467,cs,你好,hello"
我只想要前九个字节
private static Encoding _encoding = System.Text.Encoding.GetEncoding("GB2312"); private void RibbonForm1_Load(object sender, EventArgs e) { String str = "买价1,467cs,你好,hello"; labelControl1.Text = str.Substring(0, 9); labelControl2.Text = SubstringByte(str, 0, 9); labelControl3.Text = cutSubstring(str, 8); labelControl4.Text = SubstringByte(str, 0, 3); labelControl5.Text = cutSubstring(str, 3); } //第一种方法 private string SubstringByte(string text, int startIndex, int length) { byte[] bytes = _encoding.GetBytes(text); return _encoding.GetString(bytes, startIndex, length); } //第二种方法 private string cutSubstring(string s, int length) { byte[] bytes = System.Text.Encoding.Unicode.GetBytes(s); int n = 0; // 表示当前的字节数 int i = 0; // 要截取的字节数 for (; i < bytes.GetLength(0) && n < length; i++) { // 偶数位置,如0、2、4等,为UCS2编码中两个字节的第一个字节 if (i % 2 == 0) { n++; // 在UCS2第一个字节时n加1 } else { // 当UCS2编码的第二个字节大于0时,该UCS2字符为汉字,一个汉字算两个字节 if (bytes[i] > 0) { n++; } } } // 如果i为奇数时,处理成偶数 if (i % 2 == 1) { // 该UCS2字符是汉字时,去掉这个截一半的汉字 if (bytes[i] > 0) i = i - 1; // 该UCS2字符是字母或数字,则保留该字符 else i = i + 1; } return System.Text.Encoding.Unicode.GetString(bytes, 0, i); }
以上是结果展示。
一天积累一点。。。加油!
天再高,踮起脚尖就能更接近阳光