zwei1121

博客园 首页 新随笔 联系 订阅 管理

PS:学了正则表达式那么久,也没做出什么像样的模式出来,早上一觉醒来突发奇想,下定决心要证明一下咱正则可不是白学的——于是选择了最常见的日期匹配……

 

日期格式:年-月-日,即yyyy-mm-dd,如今天的日期为2008-11-1,当然按照yyyy-mm-dd的模式就是2008-11-01。我们的表达式应该同时匹配这两种日期——月、日为个位数的时候,前边的‘0’可有可无。

 

再有的一点,估计我们匹配万年历的机会不是太多,一般情况下,小打小闹,匹配个生辰八字,起始、终止日期就够了,于是我的表达式只匹配1900-2099——估计就我一般年龄的人是很难超越这两个年份的吧……

 

废话少说,开始写表达式吧。

 

首先当然是年份了——/((19|20)\d{2})/。(这里用了Perl的写法,由于Javascript沿用了此法,而且这种方法确实很简洁,所以我个人非常喜欢。)

 

匹配年份是整个表达式中最简单的部分,以下建立月和日的表达式可能出现多种情况,我只能在整个表达式中建立多种模式以供匹配的时候选择,在这些模式中,年份的部分基本上是一样的(除了闰年)。

 

小学生都知道的一件事:一年的12个月里,1、3、5、7、8、10、12月份中每月有31天,4、6、9、11月份中每月有30天,而2月最特殊,2月份只有28天而且闰年的时候是29天——对于闰年,我们等处理完一般情况再考虑特殊处理。

 

31天的月份——/(0?[13578]|1[02])/

日期——/(0?[1-9]|[12]\d|3[01])/

1. 综上,匹配31天的月份模式为:/(年)-(月)-(日)/,即/((19|20)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01])/

 

30天的月份——/(0?[469]|11)/

日期——/(0?[1-9]|[12]\d|30)/

2. 综上,匹配30天的月份模式为:/(年)-(月)-(日)/,即/((19|20)\d{2})-(0?[469]|11)-(0?[1-9]|[12]\d|30)/

 

以下匹配一般年份的2月,即28天的2月。

月份——/0?2/

日期——/(0?[1-9]|1\d|2[0-8])/

3. 综上,匹配28天的2月模式为:/(年)-(月)-(日)/,即/((19|20)\d{2})-0?2-(0?[1-9]|1\d|2[0-8])/

 

综合1、2、3,可建立匹配除了闰年之外的日期即——
/((31天的月份)|(30天的月份)|(28天的2月))/,即——
/((((19|20)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((19|20)\d{2})-(0?[469]|11)-(0?[1-9]|[12]\d|30))|(((19|20)\d{2})-0?2-(0?[1-9]|1\d|2[0-8])))/

 

到了这一步,我们要开始考虑闰年的2月了,我们都知道闰年的2月有29天,但到底什么才是闰年呢??

我们先花点时间列举出1900-2099之间,那些年份是闰年吧

1904,1908,1912,1916,1920,1924,1928,1932,1936,1940,1944,1948,1952,1956,1960,1964,1968,1972,1976,1980,1984,1988,1992,1996,2000,2004,2008,2012,2016,2020,2024,2028,2032,2036,2040,2044,2048,2052,2056,2060,2064,2068,2072,2076,2080,2084,2088,2092,2096

 

闰年:能够被4整除,若是整百年还必须被400整除,如1900是整百年但不能被400整除所以不是闰年,而2000年是闰年。

 

或许我们都知道闰年该怎么算,但是正则表达式不知道,正则表达式内部是没有计算能力的,我们所能做的就是替它找出一个能够在有限次内列举出所有可能的解决方案——所以,以上我列举出所有的闰年并不是吃饱了撑着,而是为了替表达式找出规律……

 

认真分析以上闰年之后,很容易发现:
1. 个位数必是偶数
2. 十位数为奇数时,个位数只有两种可能:2和6
3. 十位数为偶数(除0外)时,个位数有三种可能:0、4、8
4. 十位数为0时,个位数为4和8,2000年特殊处理

 

所以,匹配闰年年份如下:/(((19|20)([13579][26]|[2468][048]|0[48]))|(2000))/

所以,闰年2月分的匹配模式为/(((19|20)([13579][26]|[2468][048]|0[48]))|(2000))-0?2-(0?[1-9]|[12]\d)/

 

综合前面的所有模式,即可得出匹配日期的正则表达式了
/^((((19|20)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((19|20)\d{2})-(0?[469]|11)-(0?[1-9]|[12]\d|30))|(((19|20)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|((((19|20)([13579][26]|[2468][048]|0[48]))|(2000))-0?2-(0?[1-9]|[12]\d)))$/

 

以上表达式并不是最优的,至少以下的方式会比较优良:
/^((((19|20)\d{2})-(0?[13-9]|1[012])-(0?[1-9]|[12]\d|30))|(((19|20)\d{2})-(0?[13578]|1[02])-31)|(((19|20)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|((((19|20)([13579][26]|[2468][048]|0[48]))|(2000))-0?2-29))$/
该表达式的匹配规则(按以下序号为顺序):
1.匹配除了2月份之外的1-30日
2.若1无法匹配,则匹配1,3,5,7,8,10,12月份的31日
3.若2无法匹配,则匹配2月份的1-28日

posted on 2014-10-13 16:47  zwei  阅读(17283)  评论(0编辑  收藏  举报