【转】关于正则表达式匹配任意字符(包括换行符)的写法

 http://parkmy.javaeye.com/blog/423440

今天在Java中想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配 规则:


(.*)

结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字 符。同时,手册上还有一句话:要匹配包括 '\n' 在内的任何字符,请使用像 '[.\n]' 的模式。于是我将正则表达式的匹配规则修改如下:

([.\n]*),当然,如果是在java程序中直接写到话,需要改为 ([.\\n]*)

结果再次运行程序,发现什么内容也取不到了。我百思不得其解,又将其修改为如下规则:

([.|\n]*) 以及 ([\n.]*)

 

注意:[]中的.就表示.,不再表示"匹配除了换行之外的字符",故可以用 ((.|\n)*)来代替包含换行符的任意字符,注意小括号和中括号的不同,还有有时候换行符需要用“\r\n”表示,此时改为 ((.|\r\n)*)出处: http://topic.csdn.net/t/20051010/18/4317410.html 

 

结果还是不行,什么内容都取不到。看来点符号和换行符卯上劲了~

然后上网一查,虽然没有查出上述规则到底是什么地方出问题了,但是查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为 正确的正则表达式匹配规则:

([\s\S]*)

同时,也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。

本文可以自由转载,转载时请保留全文并注明出处:
转载自仲子说 [ http://www.wangzhongyuan.com/ ]
原文链接:http://www.wangzhongyuan.com/archives/640.html

在文本文件里, 这个表达式可以匹配所有的英文
/[ -~]/
这个表达式可以匹配所有的非英文(比如中文)
/[^ -~]/

posted @ 2010-11-08 11:51  大笑江湖  阅读(501)  评论(0编辑  收藏  举报