Java字符串String 集合的迭代器
Java字符串String
我们知道Java的字符窜是Immutable(不可变)的,一旦创建就不能更改其内容了;平常我们对字符串的操作是最多的,其实对字符串的操作,返回的字符串都是新建的字符串对象,原来并没有被改动,这跟C#是一模一样的;
既然字符串是不可变量,当我们对字符串进行各种操作时的效率肯定是有影响的,比如我们平时最常用的 + 运算符:
public class ConcatString{
public static void main(String[] args) {
var name = "marson";
var s = "abc" + name + "shine" + 47+ "nancy" + "summer zhu";
print(s);
}
}
这段代码我相信在我们日常开发中很容易遇见,它这里还没开始相加,就开辟了6段字符串对象,然后+起来又形成新的String对象,所以可以想象,当我们遇到大量(长度未可知且预知高于一定值的)字符串拼接时,会产生多少新的对象,对内存,性能造成不小的影响。
所以这时候就有了StringBuilder
StringBuilder
StringBuilder的目的就是为了解决String的不变量的问题的,StringBuilder在内部维护初始容量为16(可动态扩展)的对象,它是一个变量,所以它append字符串时返回的对象是同一个。所以存在大量的字符串拼接时,StringBuilder是可以明显优于String;
在JAVA SE5前,StringBuffer充当StringBuilder的角色,但是StringBuffer是线程安全的,细扣源码就会发现,里面含有大量的关键字synchronized,所以性能开销也比较大。
下面是StringBuilder的demo
public void UsingStringBuilder(){
var sb = new StringBuilder();
sb.append("abc").append("marson").append("shine")
.append("summer").append("zhu");
System.out.println(sb);
}
StringBuilder隐藏的陷阱
下面我们来学习《Java编程思想》一书中提到的一种StringBuilder场景,贴下代码:
public class InfiniteRecursion {
@Override
public String toString() {
return "InfiniteRecursion address: " + this + "\n";
}
public static void main(String[] args) {
var v = new ArrayList<InfiniteRecursion>();
for (int i = 0; i < 10; i++) {
v.add(new InfiniteRecursion());
}
System.out.println(v);
}
}
这种情况稍微不注意,就会犯下上面这段代码一样的错误——StackOverflowError
这是由于无限递归导致的堆栈内存溢出的错误,因为InfinitialRecursion类复写了toString,并且返回一个字符串+拼接操作符。尽管拼接的对象是this对象,但是由于是字符串的拼接,所以jvm会自动转型为String类型,从而再次调用toString,最后导致错误出现。
关于字符串池——intern
Java关于字符串对象,其实有一个装载字符串的容器——字符串池(pool of strings),新建的String对象,只要池中不存在,那么就可以存进去,并生成唯一个引用,当我们新建一个内容一样的字符串内容,我们可以直接引用池中的字符串对象,进而减小新建字符串带来的开销提高应用程序性能,而String的实例方法intern就是这个作用:
public class StringIntern {
public static void main(String[] args) {
var s = "MarsonShine";
var ss = new String("MarsonShine");
var sss = ss.intern();
System.out.println("s == ss: " + (s == ss));// false
System.out.println("s == sss: "+(s == sss));// true
System.out.println("ss == sss: "+(ss == sss));// false
}
}
String VS StringBuilder
最后我们来比较一下String与StringBuilder拼接字符串的性能对比来结束我们这个话题
public class StringVsStringBuilder {
private static final String INIT_STRING = "abcdefghijklmn1234567890";
public static void main(String[] args) {
var sw = new Stopwatch();
sw.start();
var str = "";
for (int i = 0; i < 100000; i++) {
str += INIT_STRING;
}
sw.end();
System.out.println("String + 运行时间:" + sw.ElapsedMilliseconds() + " ms");
sw.restart();
var sb = new StringBuilder();
for (int i = 0; i < 100000; i++) {
sb.append(INIT_STRING);
}
sw.end();
System.out.println("StringBuilder append 运行时间:" + sw.ElapsedMilliseconds() + " ms");
}
}
这个类里面分别用String,StringBuilder对定长的字符串对象INIT_STRING多次拼接
测试结果肯定也如大家所料,后者时间要远远小于前者的。但是当拼接的字符串比较少时,其差别就微乎其微了,理论上在少量字符串的拼接过程中,StringBuilder的性能是要逊色于String的,但是在我电脑上经过大量的测试,发现StringBuilder的性能始终要强与String的,我都有些怀疑是不是我Stopwatch辅助类写错了 - -;
最后我来把这个段代码附上吧
package performance;
public class Stopwatch {
private long startTime;
private long endTime;
public void start(){
startTime = System.currentTimeMillis();
}
public void end(){
endTime = System.currentTimeMillis();
}
public void restart(){
startTime = System.currentTimeMillis();
}
public long ElapsedMilliseconds(){
return endTime - startTime;
}
}
后记
因为我想弄清楚Java中的+操作符实际上是怎么调用的,运行的过程是怎么样的,是不是跟C#一样调用的是concat方法?
后来我通过反编译java代码发现string的+操作符在JVM变成了动态指令调用:
invokedynamic 指令去调用java.lang.invoke.makeConcatWithConstants方法,然后根据MethodHandler以及MethodType信息生成CallSite信息去执行具体的函数,但就CallSite调用那个过程我没搞清楚,调试断点也摸不清楚(Idiea玩不转 - -)
有了解的同学希望告诉我下^_^
集合的迭代器
任何集合都有迭代器。
任何集合类,都必须能以某种方式存取元素,否则这个集合容器就没有任何意义。
迭代器,也是一种模式(也叫迭代器模式)。在java中它是一个对象,其目的是遍历并选中其中的每个元素,而使用者(客户端)无需知道里面的具体细节。迭代器要足够的“轻量”——创建迭代器的代价小。所以看迭代器的源代码就会发现,里面会有很多要求:
- iterator方法返回一个Iterator,Iterator返回序列的头元素。
- next方法获取下一个元素
- hasNext检查还有元素
- remove删除迭代器新返回的元素
下面是迭代器的基本使用
public class UsingIterator {
public static void main(String[] args) {
List<String> names = Arrays.asList("marson", "shine", "summer", "zhu");
Iterator<String> it = names.iterator();
while(it.hasNext()){
String s = it.next();
print(s);
}
for (String s : names){
print(s);
}
System.out.println();
it = names.iterator();
for (int i = 0; i < 4; i++) {
it.next();
}
print(names);
}
}
ListIterator
ListIterator是一个更强大的Iterator子类型,能用于各种List类访问,前面说过Iterator支持单向取数据,ListIterator可以双向移动,所以能指出迭代器当前位置的前一个和后一个索引,可以用set方法替换它访问过的最后一个元素。我们可以通过调用listIterator方法产生一个指向List开始处的ListIterator,并且还可以用过重载方法listIterator(n)来创建一个指定列表索引为n的元素的ListIterator。
public class ListIteration {
public static void main(String[] args) {
var names = Arrays.asList("marson", "shine", "summer", "zhu");
var it = names.listIterator();
while (it.hasNext()) {
print(it.next() + ", " + it.nextIndex() + ", " + it.previousIndex() + "; ");
}
while (it.hasPrevious()) {
print(it.previous() + " ");
}
print(names);
it = names.listIterator(3);
while (it.hasNext()) {
it.next();
it.set("alias");
}
print(names);
}
}
输出结果为:
marson, 1, 0;
shine, 2, 1;
summer, 3, 2;
zhu, 4, 3;
zhu
summer
shine
marson
[marson, shine, summer, zhu][marson, shine, summer, alias]
Iterator模式
前面说了,迭代器又叫迭代器模式,顾名思义,只要符合这种模式都能叫迭代器模式,自然也能像前面一样使用迭代器
那么Iterator模式具体是个什么样子的模式呢?
我们通过Collection的源码发现其中的样子(为什么要看Collection而不是其他的List?因为Collection是所有容器的基类啊)
通过Collection代码我们发现它继承了一个叫Iterable<T>
接口,注解说的很清楚——实现这个接口就说明这个对象是可迭代的;并且其成员函数也很清晰,只有三个方法
public interface Iterable<T> {
Iterator<T> iterator();
default void forEach(Consumer<? super T> action); //省略部分代码
default Spliterator<T> spliterator(); //省略部分代码
}
public interface Iterator<E> {
boolean hasNext();
E next();
default void remove() {
throw new UnsupportedOperationException("remove");
}
...
}
Iterator这个泛型接口才是我们真正实现迭代的核心,通过这些信息我们尝试来写一个迭代器
public class CustomIterator implements Iterable<String> {
protected String[] names = ("marson shine summer zhu").split(" ");
public Iterator<String> iterator() {
return new Iterator<String>() {
private int index = 0;
@Override
public boolean hasNext() {
return index < names.length;
}
@Override
public String next() {
return names[index++];
}
public void remove() {
}
};
}
public static void main(String[] agrs) {
for (var s : new CustomIterator()) {
print(s + " ");
}
}
}
到这里,自定义的迭代器就写完了,实际上我们只需要继承一个Iterable接口然后实现这个接口就行了,更深入的话,其实还可以自己写一个listIterator实现双向的操作数据