异常空格,ASCII (194,160)问题

  今天运营的同学反映有一些店铺的名称后面带空格,我下意识的说不可能啊,我已经处理过了啊。然后就找出来看。

其中有个店铺的名称是“安踏 ”,第一眼看上去好像是带了个空格。然后我就仔细的看了下。

  

1  pry(main)> "安踏 ".strip
2 => "安踏 "

竟然没有变化。

1 pry(main)> "安踏 "[-1] == " "
2 => false

怪不得,原来不是一个空格。

到底是什么呢? 对,查一下ascii码

1 pry(main)> " ".bytes
2 => [32]

空格的ascii 是32

1 pry(main)> "安踏 "[-1].bytes
2 => [194, 160]

这个竟然是194,160. 原来如此。

  原因是字符串中的一个空格(ASCII:32)被UTF-8编码之后变成了字符(ASCII:194 和 160的组合)。在 UTF-8编码里面存在一个特殊的字符,其编码是“0xC2 0xA0”,转换成字符的时候表现为一个半角空格,跟一般的半角空格(ASCII 0x20)不同的是它的宽度不会被压缩,所以排版中常能用到它。但是GB2312、Unicode之类并没有这样的字符,所以转换后前台会显示为“?” 号,只是显示为问号而不是真正的问号,所以无法被替换。

 

解决方法是:

1 Shop.each do |shop|
2    if shop.name.include?(" ")  
3      shop.name = shop.name.split(" ")[0]    
4      shop.save
5   end  
6 end 

 

 

posted @ 2014-05-06 16:47  wangyuyu  阅读(5309)  评论(0编辑  收藏  举报