技术杂记-日期时间字符串解析识别

  日期时间的格式可谓千奇百怪,做数据汇集相关项目时就会需要识别各种日期时间格式(因为数据来源广泛不可控),然后转换为标准格式或Date类型。

  我之前看到同事的一个时间解析方法,当时觉得已经很不错了,后来网上搜索发现这个方法在搜索结果中多次出现,来源就不清楚。我是因项目需要更精确的识别日期时间字符串,于是我慢慢改进原来的方法,以下就是改进后的方法,java语言实现,只要看懂逻辑,应该很容易翻译成其他语言。

    /**
    * 解析大部分常见日期格式 <br/>
    * @author jingma@iflytek.com
    * @param dateStr 要解析的字符串
    * @return 时间对象,解析失败则为空
    */
    public static Date parseDate(String dateStr){
        if(StringUtil.isBlank(dateStr)){
            return null;
        }
        String parse = dateStr;
        DateFormat format = null;
        parse = parse.replaceFirst("^(18|19|20|21){1}[0-9]{2}([^0-9]?)", "yyyy$2");
        parse = parse.replaceFirst("^[0-9]{2}([^0-9]?)", "yy$1");
        parse = parse.replaceFirst("([^0-9]?)(1{1}[0-2]{1}|0?[1-9]{1})([^0-9]?)", "$1MM$3");
        parse = parse.replaceFirst("([^0-9]?)(3{1}[0-1]{1}|[0-2]?[0-9]{1})([^0-9]?)", "$1dd$3");
        parse = parse.replaceFirst("([^0-9]?)(2[0-3]{1}|[0-1]?[0-9]{1})([^0-9]?)", "$1HH$3");
        parse = parse.replaceFirst("([^0-9]?)[0-5]?[0-9]{1}([^0-9]?)", "$1mm$2");
        parse = parse.replaceFirst("([^0-9]?)[0-5]?[0-9]{1}([^0-9]?)", "$1ss$2");
        try {
            format = new SimpleDateFormat(parse);
            //设置为严格验证时间格式,默认是非严格的,1月32不会报错,会解析为2月1号。
            format.setLenient(false);
            Date date = format.parse(dateStr);
            log.debug(String.format("原始字符串:%s,判断格式:%s,解析结果:%s", dateStr,parse,sdf.format(date)));
            return date;
        } catch (Exception e) {
            log.error(String.format("日期解析出错:%s-->%s",parse,dateStr));
            log.debug(null, e);
        }
        return null;
    }

 

posted @ 2015-12-29 21:09  马进举  阅读(1729)  评论(0编辑  收藏  举报