按照字节截取字符串

C#中substring默认是将汉字当一个字节来截取的,但是我需要把汉字按照2个字节来算。

如果String str = "买价1,467,cs,你好,hello"

我只想要前九个字节

private static Encoding _encoding = System.Text.Encoding.GetEncoding("GB2312");
     private void RibbonForm1_Load(object sender, EventArgs e)
        {
            String str = "买价1,467cs,你好,hello";
            labelControl1.Text = str.Substring(0, 9);
            labelControl2.Text = SubstringByte(str, 0, 9);
            labelControl3.Text = cutSubstring(str, 8);
            labelControl4.Text = SubstringByte(str, 0, 3);
            labelControl5.Text = cutSubstring(str, 3);
        }
     //第一种方法
     private string SubstringByte(string text, int startIndex, int length)
     {
         byte[] bytes = _encoding.GetBytes(text);
         return _encoding.GetString(bytes, startIndex, length);
     }

     //第二种方法
     private string cutSubstring(string s, int length)
     {
         byte[] bytes = System.Text.Encoding.Unicode.GetBytes(s);
         int n = 0;  //  表示当前的字节数
         int i = 0;  //  要截取的字节数
         for (; i < bytes.GetLength(0) && n < length; i++)
         {
             //  偶数位置,如0、2、4等,为UCS2编码中两个字节的第一个字节
             if (i % 2 == 0)
             {
                 n++;      //  在UCS2第一个字节时n加1
             }
             else
             {
                 //  当UCS2编码的第二个字节大于0时,该UCS2字符为汉字,一个汉字算两个字节
                 if (bytes[i] > 0)
                 {
                     n++;
                 }
             }
         }
         //  如果i为奇数时,处理成偶数
         if (i % 2 == 1)
         {
             //  该UCS2字符是汉字时,去掉这个截一半的汉字
             if (bytes[i] > 0)
                 i = i - 1;
             //  该UCS2字符是字母或数字,则保留该字符
             else
                 i = i + 1;
         }
         return System.Text.Encoding.Unicode.GetString(bytes, 0, i);
     }

 

以上是结果展示。

一天积累一点。。。加油!

 

posted @ 2012-12-17 17:14  dreamfly_cc  阅读(456)  评论(0编辑  收藏  举报