Java字符串String 集合的迭代器

Java字符串String

我们知道Java的字符窜是Immutable(不可变)的，一旦创建就不能更改其内容了；平常我们对字符串的操作是最多的，其实对字符串的操作，返回的字符串都是新建的字符串对象，原来并没有被改动，这跟C#是一模一样的；

既然字符串是不可变量，当我们对字符串进行各种操作时的效率肯定是有影响的，比如我们平时最常用的 + 运算符：

public class ConcatString{
    public static void main(String[] args) {
        var name = "marson";
        var s = "abc" + name + "shine" + 47+ "nancy" + "summer zhu";
        print(s);
    }
}

这段代码我相信在我们日常开发中很容易遇见，它这里还没开始相加，就开辟了6段字符串对象，然后+起来又形成新的String对象，所以可以想象，当我们遇到大量（长度未可知且预知高于一定值的）字符串拼接时，会产生多少新的对象，对内存，性能造成不小的影响。

所以这时候就有了StringBuilder

StringBuilder

StringBuilder的目的就是为了解决String的不变量的问题的，StringBuilder在内部维护初始容量为16（可动态扩展）的对象，它是一个变量，所以它append字符串时返回的对象是同一个。所以存在大量的字符串拼接时，StringBuilder是可以明显优于String；

在JAVA SE5前，StringBuffer充当StringBuilder的角色，但是StringBuffer是线程安全的，细扣源码就会发现，里面含有大量的关键字synchronized，所以性能开销也比较大。

下面是StringBuilder的demo

public void UsingStringBuilder(){
    var sb = new StringBuilder();
    sb.append("abc").append("marson").append("shine")
        .append("summer").append("zhu");
    System.out.println(sb);
}

StringBuilder隐藏的陷阱

下面我们来学习《Java编程思想》一书中提到的一种StringBuilder场景，贴下代码：

public class InfiniteRecursion {
    @Override
    public String toString() {
        return "InfiniteRecursion address: " + this + "\n";
    }

    public static void main(String[] args) {
        var v = new ArrayList<InfiniteRecursion>();
        for (int i = 0; i < 10; i++) {
            v.add(new InfiniteRecursion());
        }
        System.out.println(v);
    }
}

这种情况稍微不注意，就会犯下上面这段代码一样的错误——StackOverflowError

这是由于无限递归导致的堆栈内存溢出的错误，因为InfinitialRecursion类复写了toString，并且返回一个字符串+拼接操作符。尽管拼接的对象是this对象，但是由于是字符串的拼接，所以jvm会自动转型为String类型，从而再次调用toString，最后导致错误出现。

关于字符串池——intern

Java关于字符串对象，其实有一个装载字符串的容器——字符串池（pool of strings），新建的String对象，只要池中不存在，那么就可以存进去，并生成唯一个引用，当我们新建一个内容一样的字符串内容，我们可以直接引用池中的字符串对象，进而减小新建字符串带来的开销提高应用程序性能，而String的实例方法intern就是这个作用：

public class StringIntern {
    public static void main(String[] args) {
        var s = "MarsonShine";
        var ss = new String("MarsonShine");
        var sss = ss.intern();
        System.out.println("s == ss: " + (s == ss));// false
        System.out.println("s == sss: "+(s == sss));//  true
        System.out.println("ss == sss: "+(ss == sss));// false
    }
}

String VS StringBuilder

最后我们来比较一下String与StringBuilder拼接字符串的性能对比来结束我们这个话题

public class StringVsStringBuilder {
    private static final String INIT_STRING = "abcdefghijklmn1234567890";

    public static void main(String[] args) {
        var sw = new Stopwatch();
        sw.start();
        var str = "";
        for (int i = 0; i < 100000; i++) {
            str += INIT_STRING;
        }
        sw.end();
        System.out.println("String + 运行时间：" + sw.ElapsedMilliseconds() + " ms");

        sw.restart();
        var sb = new StringBuilder();
        for (int i = 0; i < 100000; i++) {
            sb.append(INIT_STRING);
        }
        sw.end();
        System.out.println("StringBuilder append 运行时间：" + sw.ElapsedMilliseconds() + " ms");
    }
}

这个类里面分别用String，StringBuilder对定长的字符串对象INIT_STRING多次拼接

测试结果肯定也如大家所料，后者时间要远远小于前者的。但是当拼接的字符串比较少时，其差别就微乎其微了，理论上在少量字符串的拼接过程中，StringBuilder的性能是要逊色于String的，但是在我电脑上经过大量的测试，发现StringBuilder的性能始终要强与String的，我都有些怀疑是不是我Stopwatch辅助类写错了 - -；

最后我来把这个段代码附上吧

package performance;

public class Stopwatch {
    private long startTime;
    private long endTime;
    public void start(){
        startTime = System.currentTimeMillis();
    }
    public void end(){
        endTime = System.currentTimeMillis();
    }
    public void restart(){
        startTime = System.currentTimeMillis();
    }
    public long ElapsedMilliseconds(){
        return endTime - startTime;
    }
}

后记

因为我想弄清楚Java中的+操作符实际上是怎么调用的，运行的过程是怎么样的，是不是跟C#一样调用的是concat方法？

后来我通过反编译java代码发现string的+操作符在JVM变成了动态指令调用：

invokedynamic 指令去调用java.lang.invoke.makeConcatWithConstants方法，然后根据MethodHandler以及MethodType信息生成CallSite信息去执行具体的函数，但就CallSite调用那个过程我没搞清楚，调试断点也摸不清楚（Idiea玩不转 - -）

有了解的同学希望告诉我下^_^

希望有个生活精彩的程序人生

集合的迭代器

任何集合都有迭代器。

任何集合类，都必须能以某种方式存取元素，否则这个集合容器就没有任何意义。

迭代器，也是一种模式（也叫迭代器模式）。在java中它是一个对象，其目的是遍历并选中其中的每个元素，而使用者（客户端）无需知道里面的具体细节。迭代器要足够的“轻量”——创建迭代器的代价小。所以看迭代器的源代码就会发现，里面会有很多要求：

iterator方法返回一个Iterator，Iterator返回序列的头元素。
next方法获取下一个元素
hasNext检查还有元素
remove删除迭代器新返回的元素

下面是迭代器的基本使用

public class UsingIterator {
    public static void main(String[] args) {
        List<String> names = Arrays.asList("marson", "shine", "summer", "zhu");
        Iterator<String> it = names.iterator();
        while(it.hasNext()){
            String s = it.next();
            print(s);
        }
        for (String s : names){
            print(s);
        }
        System.out.println();
        it = names.iterator();
        for (int i = 0; i < 4; i++) {
            it.next();
        }
        print(names);
    }
}

ListIterator

ListIterator是一个更强大的Iterator子类型，能用于各种List类访问，前面说过Iterator支持单向取数据，ListIterator可以双向移动，所以能指出迭代器当前位置的前一个和后一个索引，可以用set方法替换它访问过的最后一个元素。我们可以通过调用listIterator方法产生一个指向List开始处的ListIterator，并且还可以用过重载方法listIterator(n)来创建一个指定列表索引为n的元素的ListIterator。

public class ListIteration {
    public static void main(String[] args) {
        var names = Arrays.asList("marson", "shine", "summer", "zhu");
        var it = names.listIterator();
        while (it.hasNext()) {
            print(it.next() + ", " + it.nextIndex() + ", " + it.previousIndex() + "; ");
        }

        while (it.hasPrevious()) {
            print(it.previous() + " ");
        }
        print(names);

        it = names.listIterator(3);
        while (it.hasNext()) {
            it.next();
            it.set("alias");
        }
        print(names);
    }
}

输出结果为：

marson, 1, 0;
shine, 2, 1;
summer, 3, 2;
zhu, 4, 3;
zhu
summer
shine
marson
[marson, shine, summer, zhu][marson, shine, summer, alias]

Iterator模式

前面说了，迭代器又叫迭代器模式，顾名思义，只要符合这种模式都能叫迭代器模式，自然也能像前面一样使用迭代器

那么Iterator模式具体是个什么样子的模式呢？

我们通过Collection的源码发现其中的样子（为什么要看Collection而不是其他的List？因为Collection是所有容器的基类啊）

通过Collection代码我们发现它继承了一个叫Iterable<T>接口，注解说的很清楚——实现这个接口就说明这个对象是可迭代的；并且其成员函数也很清晰，只有三个方法

public interface Iterable<T> {
    Iterator<T> iterator();
    default void forEach(Consumer<? super T> action);   //省略部分代码
    default Spliterator<T> spliterator();   //省略部分代码
｝
public interface Iterator<E> {
    boolean hasNext();
    E next();
    default void remove() {
        throw new UnsupportedOperationException("remove");
    }
    ...
｝

Iterator这个泛型接口才是我们真正实现迭代的核心，通过这些信息我们尝试来写一个迭代器

public class CustomIterator implements Iterable<String> {
    protected String[] names = ("marson shine summer zhu").split(" ");
    public Iterator<String> iterator() {
        return new Iterator<String>() {
            private int index = 0;
            @Override
            public boolean hasNext() {
                return index < names.length;
            }
            @Override
            public String next() {
                return names[index++];
            }
            public void remove() {
            }
        };
    }
    public static void main(String[] agrs) {
        for (var s : new CustomIterator()) {
            print(s + " ");
        }
    }
}

到这里，自定义的迭代器就写完了，实际上我们只需要继承一个Iterable接口然后实现这个接口就行了，更深入的话，其实还可以自己写一个listIterator实现双向的操作数据

posted @ 2018-05-27 23:17 ~雨落忧伤~ 阅读(2457) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

~雨落忧伤~