Hadoop develop

博学笃志,切问近思,此八字,是收放心的工夫。 神闲气静,智深勇沉,此八字,是干大事的本领。

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

  汉字字符的编码为双字节,对于汉字字符和单字节字符混排的情况,如果目标截取的字符串内只包含奇数个单字节字符,则会出现半个汉字字符的问题。如下所示:

  (1)天水市秦州区南郭路2号(工行七里墩分理处? --包含数字字符,单字节

  (2)七里河区金港城金福花园20号楼3号(金港城?--包含数字字符,单字节。

  (3)甘肃银馨春天餐饮服务业有限责任公司(省委? --包含英文格式半括号。

  以上为截取字符串前四位以后的显示结果,其中“?”为半个汉字编码的显示。要想解决以上问题可以采用截取最后一个非法字符,并用合法字符替换的方法。实例代码如下所示:

#include <stdio.h>
int chkHalfChinese(char *buf,int len)
{
        int i = 0;
    int cnt = 0;
    int idx;
    for(i=0;i<len;i++)
     {
           int value = buf[i]&0xFF;
        if(value>160)   
         {
           cnt++;   
           idx=i;
         }
     }
    if(cnt%2)
     {
        buf[idx] =' ';
        return(1);
     }
    else
        {
        return(0);
      }
}

int main(void)
{
  char str[44] = "天水市秦州区南郭路2啊(工行七里墩分理处里家";  
  if(chkHalfChinese(str,40)==1)
  {
    printf("true\n");
  }
  else
  {
    printf("false\n");
  }
  printf("%s\n",&str);
  return 0;
}
程序代码在Linux环境下测试通过,运行结果如下图所示:

 

 

posted on 2013-03-14 13:16  张子良  阅读(2446)  评论(5编辑  收藏  举报