删除特殊空格

需求:去除字符串里的所有空格

做法

System.out.println("指南 修 订版".replace(" ", ""));

出现问题:"南 修"之间的空格去除不了

原因:"南 修"这个字符串里有一个特殊空格,对应的Unicode码是\u0026\u0023\u0031\u0036\u0030\u003b。而普通空格对应的Unicode码是"\u0020"

下面是用python打印出来的两个空格的区别:

In [1]: print('\u0026\u0023\u0031\u0036\u0030\u003b'.encode('utf8'))
b' '

In [2]: print('\u0020'.encode('utf8'))
b' '

在一个小伙伴的帮助下得到的解决方案

Pattern p = compile("\\p{Zs}");
Matcher m = p.matcher("指南 修       订版");
System.out.println(m.replaceAll(""));

\p{Zs} will match any kind of space character

posted @ 2018-10-22 16:48  JillWen  阅读(1506)  评论(0编辑  收藏  举报