小小飞鹰

     中国人缺少的是步骤,太急。练太极!
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

截取指定长度中英文字符串

Posted on 2006-04-06 12:38  小小飞鹰  阅读(506)  评论(0编辑  收藏  举报

最近在做项目时,碰到含有中英文混在一起的字符串,而存入数据库(DB2)又是限定长度的,找到了一个比较好的截取指定长度中英文字符方法:
#region 截取指定长度中英文字符串

  /// <summary>
  /// 截取指定长度中英文字符串
  /// </summary>
  /// <param name="stringToSub">字符串</param>
  /// <param name="length">截取长度</param>
  /// <returns>返回字符串</returns>
  public static string FormatString(string stringToSub, int length)
  {
   Regex regex = new Regex("[\u4e00-\u9fa5]+", RegexOptions.Compiled);
   char[] stringChar = stringToSub.ToCharArray();
   StringBuilder sb = new StringBuilder();
   int nLength = 0;

   for (int i = 0; i < stringChar.Length; i++)
   {
    if (nLength == length - 1)
    {
     if (regex.IsMatch((stringChar[i]).ToString()))
     {
      break;
     }
    }

    if (regex.IsMatch((stringChar[i]).ToString()))
    {
     sb.Append(stringChar[i]);
     nLength += 2;
    }
    else
    {
     sb.Append(stringChar[i]);
     nLength = nLength + 1;
    }

    if (nLength >= length)
    {
     break;
    }
   }

   return sb.ToString();
  }

  #endregion