关于清理文本中的各类空白字符..
.net framework中的正则表达式 \s
\s等效于[\f\n\r\t\v]的字符分组
\f 换页(FF) 012
\n 换行(LF) 010
\r 回车(CR) 013
\t 水平制表(HT) 009
\v 垂直制表(VT) 011
由于本人处理的数据多与打印相关
而对于印刷和表意文字的空白(这些字符影响打印机)
则没有办法...
个人觉得 visual studio 查找替换中的正则
:Wh |
匹配所有类型的空白,如印刷和表意文字的空白。 |
更加有用...
尤其是对于清理文本