分享一个 Java String split 快速分割的方法

java中string.split() 方法比较强大,但是split()方法采用正则表达式,速度相对会慢一点,

其实大多数场景下并不需要使用正则表达式,下面分享一个不使用正则表达式分隔字符串的方法。

方法保证了和 string.split()的输出结果一致。

直接看代码:

    public static String[] split(String src,String delimeter){
        String srcStr = src;
        String delimeterStr = delimeter;
        if(srcStr==null){
            return null;
        }
        if(delimeterStr==null){
            throw new IllegalArgumentException("delimeter should not be null");
        }
        if(delimeterStr.equals("")){ //直接返回每个字符的字符串形式
            String[] array = new String[srcStr.length()];
            for(int i = 0;i<array.length;i++){
                array[i] = String.valueOf(srcStr.charAt(i));
            }
            return array;
        }
        if (srcStr.length() > delimeterStr.length()) { //源字符串长度大于分隔符字符串长度
            int i = srcStr.indexOf(delimeterStr);
            int j = i;
            int n = 0;
            int lastIndex = srcStr.length() - delimeterStr.length();
            boolean lastStringIsDelimeter = false;
            while (i >= 0) {
                n++;
                i = srcStr.indexOf(delimeterStr, i + delimeterStr.length());
                if (i == lastIndex) { // delimeter is the last string of the src, should not be counted
                    lastStringIsDelimeter = true;
                    break;
                }
            }
            String[] array = new String[n + 1];
            n = i = 0;
            while (j >= 0) {
                if (j - i > 0) {
                    array[n++] = srcStr.substring(i, j);
                } else if (j - i == 0) { // two delimeter is neighbour
                    array[n++] = "";
                }
                i = j + delimeterStr.length();
                j = srcStr.indexOf(delimeterStr, i);
            }
            if (!lastStringIsDelimeter) {
                array[n] = srcStr.substring(i);
            }
            return array;
        } else if (srcStr.length() == delimeterStr.length()) { // 源字符串长度等于 分隔符字符串长度
            if (srcStr.equals(delimeterStr)) {
                return new String[0];
            } else {
                String[] array = new String[1];
                array[0] = srcStr;
                return array;
            }
        } else { // 源字符串长度 小于 分隔符字符串长度 , 直接返回源字符串
            String[] array = new String[1];
            array[0] = srcStr;
            return array;
        }
    }

测试代码:

        String src = "a.b.c.d.e.f.g.h.j.k.l.";
        src = "a..b..c..d..e..f..g..h..j..k..l";
        
        System.out.println("first-->");
        long start = System.nanoTime();
        String[] array = split(src, "..");
        long end = System.nanoTime();
        System.out.println("time:"+(end-start)+"ns");
        System.out.println("size:"+array.length);
        for(String s : array){
            System.out.println(s);
        }
        System.out.println("<--end");
        
        System.out.println("second-->");
        long start1 = System.nanoTime();
        String[] array2 = src.split("\\.\\.");
        long end1 = System.nanoTime();
        System.out.println("time:"+(end1-start1)+"ns");
        System.out.println("size:"+array2.length);
        for(String s : array2){
            System.out.println(s);
        }
        System.out.println("<--end");

运行结果,可以看出,不采用正则表达式时,速度快了一些,当然此单次测试并不一定准确, 读者可以自己写一个多次循环求平均值的代码进行测试。

需要注意的是, 代码中并未加锁进行同步,因为此代码没有并发的问题,变量范围始终在局部变量表内,JVM中是线程独立的。

本人水平有限,如有问题,欢迎评论指正。

转载请注明出处。

 

posted @ 2017-09-13 11:43  WanderingAlbatross  阅读(628)  评论(0编辑  收藏  举报