JavaSE中线程与并行API框架学习笔记1——线程是什么?

前言:虽然工作了三年,但是几乎没有使用到多线程之类的内容。这其实是工作与学习的矛盾。我们在公司上班,很多时候都只是在处理业务代码,很少接触底层技术。

 

可是你不可能一辈子都写业务代码,而且跳槽之后新单位很可能有更高的技术要求。除了干巴巴地翻书,我们可以通过两个方式来解决这个问题:一是做业余项目,例如在github上传自己的demo,可以实际使用;二是把自己的学习心得写成博客,跟同行们互相交流。

 

3.1 线程的初窥门径

我们在之前的文章里提到的程序其实都是单线程程序,也就说启动的程序从main()程序进入点开始到结束只有一个流程。然而,有时候我们设计的程序需要有多个流程,也就是所谓的多线程(Multi-thread)程序。

 

我们可以通过一个龟兔赛跑的游戏开始学习单线程和多线程的区别。乌龟和兔子赛跑,起点到终点为10米,每经过一秒,乌龟会前进0.1米;兔子可能前进1米或睡觉。如果使用单线程,我们可以这样设计:

 1 /**
 2  * 线程实验用例
 3  */
 4 public class TortoiseHareRace {
 5     public static void main(String[] args) throws InterruptedException {
 6         float totalLength = 10;
 7         float tortoiseLength = 0;
 8         float hareLength = 0;
 9         System.out.println("龟兔赛跑大赛,开始!");
10         while(tortoiseLength < totalLength && hareLength < totalLength) {
11             Thread.sleep(1000);
12             tortoiseLength += 0.1;
13             System.out.println("乌龟跑了 " + tortoiseLength + " 米...");
14             boolean isHareSleep = Math.random()*10 < 9;
15             if(isHareSleep) {
16                 System.out.println("兔子睡着了zzzz");
17             } else {
18                 hareLength ++;
19                 System.out.println("兔子跑了 " + hareLength + " 米...");
20             }
21         }
22     }
23 }

 

这个程序里面只有一个流程,就是从main()方法开始到结束的流程。要让目前流程暂停指定时间,可以使用java.lang.Thread的静态sleep()方法,单位是毫秒。调用这个方法必须处理java.lang.InterruptedException,在这里直接在main()中声明 throws,由JVM来处理此异常。

 

每次暂停一秒后,tortoiseLength递增0.1,表示乌龟向前爬了0.1米,兔子则可能有百分之90的可能性睡觉。如果不睡觉,hareLength会递增1,表示兔子向前蹦了1米。只要他们任意一个跑了10米,表示到达终点,分出胜负比赛结束。

 

由于程序只有一个流程,所以每次只能先让乌龟先跑再让兔子跑,这就很不公平(如果倒过来,也是不公平)。如果程序里再有两个流程,一个是乌龟在跑,一个是兔子在跑,是不是程序逻辑会更加合理和清晰呢?

 

在Java中,如果想在main()以外独立设计流程,可以实现java.lang.Runnable接口,流程的进入点是在run()方法里面。例如,我们可以这样设计乌龟的流程: 

 1 /**
 2  * 乌龟线程
 3  */
 4 public class Tortoise implements Runnable{
 5     private float totalLength;
 6     private float length;
 7 
 8     public Tortoise(float totalLength) {
 9         this.totalLength = totalLength;
10     }
11 
12     @Override
13     public void run() {
14         try {
15             while(length < totalLength) {
16                 Thread.sleep(1000);
17                 length += 0.1;
18                 System.out.println("乌龟跑了 " + length + " 米...");
19             }
20         } catch (InterruptedException ex) {
21             throw new RuntimeException(ex);
22         }
23     }
24 }

 

在Tortoise类中,乌龟的流程会从run()开始。在这个流程里,代码只需要专心负责乌龟每秒爬0.1米就可以了,不用夹杂兔子的动作。同样地,我们可以类似地设计兔子的流程:

 1 /**
 2  * 兔子线程
 3  */
 4 public class Hare implements Runnable{
 5     private float totalLength;
 6     private float length;
 7 
 8     public Hare(int totalLength) {
 9         this.totalLength = totalLength;
10     }
11 
12     @Override
13     public void run () {
14         try {
15             while(length < totalLength) {
16                 Thread.sleep(1000);
17                 boolean isHareSleep = Math.random()*10 < 9;
18                 if(isHareSleep) {
19                     System.out.println("兔子睡着了zzzz");
20                 } else {
21                     length ++;
22                     System.out.println("兔子跑了 " + length + " 米...");
23                 }
24             }
25         } catch (InterruptedException ex) {
26             throw new RuntimeException(ex);
27         }
28     }
29 }

 

在Java中,从main()方法开始的流程会由主线程(Main Thread)来跑。那么刚才设计的兔子线程和乌龟线程,应该让谁来执行呢?我们可以通过创建Thread对象的方法来执行Runnable对象定义的run()方法,例如:

 1 /**
 2  * 龟兔赛跑主线程
 3  */
 4 public class TortoiseHare2 {
 5     public static void main(String[] args) {
 6         Tortoise tortoise = new Tortoise(10);
 7         Hare hare = new Hare(10);
 8         Thread tortoiseThread = new Thread(tortoise);
 9         Thread hareThread = new Thread(hare);
10         tortoiseThread.start();
11         hareThread.start();
12     }
13 }

 

要记住,在创建Thread对象之前,必须确保实例化的参数实现了Runnable接口,并且要在之后执行start()方法,以下是其中一个执行结果:

 

我们都在学校里学习过线程的概念,但这都只是逻辑上的认识,并不代表我们已经完全掌握其实际内容。通过做实验的方式,我们写了代码,引入了耳熟能详的儿童故事,加深认识的同时也增强了记忆。

 

3.2继承父类 or 实现接口

从抽象观点与开发者的角度来看,JVM是台虚拟计算机,只安装了一颗被称为主线程的CPU,可执行main()定义的执行流程。如果想要为JVM加装CPU,就是创建Thread实例,要启动额外CPU就是调用Thread实例的start()方法。额外CPU执行流程的进入点,可以定义在Runnable接口的run()方法里面。

 

当然了,实际上JVM启动之后并不只有一个主线程,还有垃圾收集、内存管理等线程,不过这是底层机制。我们暂时不用理会。

 

除了将流程定义在Runnable的run()方法之外,还有另外一个使用多线程的方法,就是继承Thread类,重新定义run()方法。例如我们可以这样的改写乌龟流程:

 1 /**
 2  * 乌龟的线程
 3  */
 4 public class Tortoise extends Thread{ //继承Thread类
 5     private float totalLength;
 6     private float length;
 7 
 8     public Tortoise(float totalLength) {
 9         this.totalLength = totalLength;
10     }
11 
12     @Override
13     public void run() {
14         try {
15             while(length < totalLength) {
16                 Thread.sleep(1000);
17                 length += 0.1;
18                 System.out.println("乌龟跑了 " + length + " 米...");
19             }
20         } catch (InterruptedException ex) {
21             throw new RuntimeException(ex);
22         }
23     }
24 }

 

由于大部分代码都一样,所以就不再把整个demo重新贴出来一遍了。但还是建议各位朋友,尤其是初学者们,千万要自己动手改一改,看看两种写法到底有什么不同。

 

在Java中,任何线程可执行的流程都要定义在Runnable的run()方法。事实上,Thread类本身也实现了Runnable接口,从JDK源码当中我们可以看到:

 1     /**
 2      * If this thread was constructed using a separate
 3      * <code>Runnable</code> run object, then that
 4      * <code>Runnable</code> object's <code>run</code> method is called;
 5      * otherwise, this method does nothing and returns.
 6      * <p>
 7      * Subclasses of <code>Thread</code> should override this method.
 8      *
 9      * @see     #start()
10      * @see     #stop()
11      * @see     #Thread(ThreadGroup, Runnable, String)
12      */
13     @Override
14     public void run() {
15         if (target != null) {
16             target.run();
17         }
18     }

 

了解完两种多线程的实现方法之后,我们会有一个疑问:到底是实现Runnable()好呢,还是直接继承Thread类更好?这就要根据具体情况具体分析了。

 

实现接口的好处是灵活,这个类还可以继承其他类。如果你想要直接利用Thread中定义的某些特定方法,那就可以考虑直接继承Thread类。要想做到灵活应用,这就要求开发者足够了解这些接口和类。没有别的捷径,就是多看API说明文档和多阅读JDK源代码。

 

3.3 线程的生命周期

有一个古老的谜语,说是有一种动物,早上是四条腿,中午就成了两条腿,到了傍晚却是三条腿。我们大家都知道,谜底就是人。

 

从小孩到长大成人,再到衰老死亡,这就是我们人类的生命周期。线程也是一样,从创建到开始,再到最后的结束。理解人类的生命周期,有助于我们更好地认识自己,规划自己的人生。熟悉线程的生命周期,则会对我们使用线程有莫大的帮助。

 

线程的生命周期相当复杂,我们将会从最简单的开始讲起。

 

3.3.1 Daemon线程

Daemon,本义是守护神的意思,在希腊神话里是半人半神的精灵。在计算机领域,daemon已经是一个专业术语,我们可以理解成守护进程或守护线程。

 

大人物出现活动,如果他不离场,安保人员是不可能会撤离的。Java中的守护进程也一样,如果主线程中启动了额外线程,默认会等待被启动的所有线程都执行完run()方法之后才中止JVM。如果一个Thread被标识为Daemon线程,那么在所有的非Daemon线程都结束时,它也会被JVM自动终止。

 

从main()方法开始的就是一个非Daemon线程。我们可以使用setDaemon()方法来设定一个线程是否属于Daemon线程。下面是一个非常简单的demo,实验的时候你可以试着取消setDaemon()那行代码的注释,看看会有什么不同,为什么:

 1 /**
 2  * Daemon实验用例
 3  */
 4 public class DaemonDemo {
 5     public static void main(String[] args) {
 6         Thread thread = new Thread() {
 7             public void run() {
 8                 while(true) {
 9                     System.out.println("run...");
10                 }
11             }
12         };
13         //thread.setDaemon(true); //把线程设定为Daemon线程
14         thread.start();
15     }
16 }

 

如果没有使用setDaemon()方法设定为true,上面这个程序就会不会输出“run...”,永远不会自动终止。可是如果一旦将其设置为Daemon线程,在其启动的一瞬间就会被终止,甚至连一句输出都没有。

 

有趣的是,默认所有从Daemon线程产生的线程也是Daemon线程。其实这也不难理解,因为基本上来说由一个后台服务线程衍生出来的线程,也应该是为了在后台服务而产生的,所以在产生它的线程停止时,也应该一并跟着停止。

 

3.3.2 线程状态图

在看过最简单的线程生命周期之后,我们再来看复杂一点的。调用Thread对象的start()方法之后,该线程的基本状态基本可以分为三种:可执行(Runnable)、别阻断(Blocked)、执行中(Running)。

 

三种状态之间的转移一两句话说不清楚,我们可以借助状态图来帮助我们理解:

     

 

我们可以一边对照着上面这幅图,一边看接下来的讲述。实例化Thread并执行start()方法之后,线程就会进入Runnable状态。这个时候线程并没有真正开始执行run()方法,必须等待排班器(Scheduler)排入CPU执行,线程才会跑run()方法,这就进入了Running状态。

 

线程有优先权重,可以使用Thread的setPriority()方法来设定优先权。设定的范围是1(Thread.MIN_PRIORITY)到 10(Thread.MAX_+PRIORITY),默认是5(Thread.NORM_PRIORITY)。数字越大优先权越高,调度器越有限排入CPU,也就是越优先进入Running状态。如果优先权相同,则轮流执行(Round-robin)。

 

有几种情况会让线程进入Blocked状态,例如前面调用过的Thread.sleep()方法,又例如等待输入输出等等。我们之所以要运用多线程,就是要让当前线程进入Blocked状态的时候让另一线程排入CPU执行,即进入Running状态,避免CPU无谓的空闲。这就是我们常用的,用来改进性能的方式之一。

 

下面我们可以用一个下载网页的demo来进行测试,看看不使用多线程时需要花费多长时间:

 1 import java.net.URL;
 2 import java.io.*;
 3 import java.util.Date;
 4 
 5 /**
 6  * 单线程实验用例
 7  */
 8 public class Download {
 9     public static void main(String[] args) throws Exception {
10         URL[] urls = {
11                 new URL("http://www.cnblogs.com/levenyes/p/7117559.html"),
12                 new URL("http://www.cnblogs.com/levenyes/p/7120267.html"),
13                 new URL("http://www.cnblogs.com/levenyes/p/7145214.html"),
14                 new URL("http://www.cnblogs.com/levenyes/p/7163843.html")
15         };
16 
17         String[] fileNames = {
18                 "file1.html",
19                 "file2.html",
20                 "file3.html",
21                 "file4.html"
22         };
23         Date begin = new Date();
24         for(int i = 0 ; i < urls.length; i++) {
25             dump(urls[i].openStream(), new FileOutputStream(fileNames[i]));
26         }
27         Date end = new Date();
28         System.out.println(end.getTime() - begin.getTime());
29     }
30 
31     private static void dump(InputStream src, OutputStream dest) throws IOException {
32         try (InputStream input = src; OutputStream output = dest) {
33             byte[] data = new byte[1024];
34             int length = -1;
35             while((length = input.read(data)) != -1) {
36                 output.write(data, 0, length);
37             }
38         }
39     }
40 }

 

每一次for循环时,会先开启网络链接、进行HTTP请求,然后再进行文档写入等等。在等待网络链接、HTTP协议时很耗时,这就意味着进入Blocked的时间相当长。因为是单线程,所以必须等第一个网页下载完了之后才能下载第二个,如此类推。

 

因为受到网络状态不稳定的影响,有的时候可能会比较快,有的时候会比较慢。经过多次测试,大概的耗时为400毫秒。

 

如果我们可以在下载第一个网页遇到等待时就开始下载其他网页,这样会不会让速度加快许多呢?例如下面这个demo:

 1 import java.net.URL;
 2 import java.io.*;
 3 import java.util.Date;
 4 
 5 /**
 6  * 多线程实验用例
 7  */
 8 public class Download {
 9     public static void main(String[] args) throws Exception {
10         final URL[] urls = {
11                 new URL("http://www.cnblogs.com/levenyes/p/7117559.html"),
12                 new URL("http://www.cnblogs.com/levenyes/p/7120267.html"),
13                 new URL("http://www.cnblogs.com/levenyes/p/7145214.html"),
14                 new URL("http://www.cnblogs.com/levenyes/p/7163843.html")
15         };
16 
17         final String[] fileNames = {
18                 "file1.html",
19                 "file2.html",
20                 "file3.html",
21                 "file4.html"
22         };
23         Date begin = new Date();
24         for(int i = 0 ; i < urls.length; i++) {
25             final int index = i;
26             new Thread() {
27                 @Override
28                 public void run() {
29                     try {
30                         dump(urls[index].openStream(), new FileOutputStream(fileNames[index]));
31                         Date end = new Date();
32                         System.out.println(end.getTime() - begin.getTime());
33                     } catch (IOException ex) {
34                         throw new RuntimeException(ex);
35                     }
36                 }
37             }.start();
38 
39         }
40 
41     }
42 
43     private static void dump(InputStream src, OutputStream dest) throws IOException {
44         try (InputStream input = src; OutputStream output = dest) {
45             byte[] data = new byte[1024];
46             int length = -1;
47             while((length = input.read(data)) != -1) {
48                 output.write(data, 0, length);
49             }
50         }
51     }
52 }

 

经过多次测试,我们会发现耗费的时间要比单线程快得多,多线程下载4个网页的时间跟单线程下载1个网页的时间近似。

 

3.3.3 安插线程

程序员常常会有这样的经验:正在热火朝天地赶一个需求,突然被告知之前负责的项目出了严重问题要紧急处理,这时候只好放下开发工作去修bug。

 

如果一个线程正在运行,有另一个线程要插入进来优先运行,要怎么做呢?我们可以使用join()方法,会让插入的线程执行完毕之后再继续原来的线程。我们可以通过一个简单的实验来感受一下join()的用法:

 1 /**
 2  * Join实验用例
 3  */
 4 public class JoinDemo {
 5     public static void main(String[] args) {
 6         System.out.println("Main thread 开始...");
 7         Thread threadB = new Thread() {
 8             @Override
 9             public void run() {
10                 try {
11                     System.out.println("Thread B 开始...");
12                     for (int i = 0; i < 5; i++) {
13                         Thread.sleep(1000);
14                         System.out.println("Thread B 执行...");
15                     }
16                     System.out.println("Thread B 将结束...");
17                 } catch (InterruptedException e) {
18                     e.printStackTrace();
19                 }
20             }
21         };
22 
23         threadB.start();
24 
25         try {
26             threadB.join();//B线程插入到Main线程里
27         } catch(InterruptedException e) {
28             e.printStackTrace();
29         }
30         System.out.println("Main thread 将结束...");
31     }
32 }

 

因为要等到B线程运行完毕才能执行主线程之后的动作,所以我们会发现输出结果如下:

 

如果把join()相关部分的代码注释掉,运行结果会有什么不同呢?我们可以先在脑海里想象一下,然后再做实验:

 

有的时候插入的线程可能会耗时很久,甚至会有死循环,我们不可能无限制地等下去。针对这个需求,我们可以使用带参数的join()方法,例如join(1000),这就表示插入的线程最多运行1秒钟。如果加入的线程耗时超过1秒钟就不理它了,当前线程可以继续执行原来的动作流程。

 

3.3.4 停止线程

线程完成run()方法后,就会进入Dead状态。进入Dead状态(或已经调用过start()方法)的线程不可以再次调用start()方法,否则会抛出IllegalThreadStateException的异常。

 

Thread类上定义有stop方法,不过已经被标识为Deprecated。Deprecated,顾名思义,就是“不赞成”、“反对”的意思。在JavaSE中被表示为Derecated的API,表示过去定义过,后来因为可能会引发某些问题,同时又为了兼容性,这些API没有直接删去,但也不建议现在的程序再使用它们。

 1     /* @deprecated This method is inherently unsafe.  Stopping a thread with
 2      *       Thread.stop causes it to unlock all of the monitors that it
 3      *       has locked (as a natural consequence of the unchecked
 4      *       <code>ThreadDeath</code> exception propagating up the stack).  If
 5      *       any of the objects previously protected by these monitors were in
 6      *       an inconsistent state, the damaged objects become visible to
 7      *       other threads, potentially resulting in arbitrary behavior.  Many
 8      *       uses of <code>stop</code> should be replaced by code that simply
 9      *       modifies some variable to indicate that the target thread should
10      *       stop running.  The target thread should check this variable
11      *       regularly, and return from its run method in an orderly fashion
12      *       if the variable indicates that it is to stop running.  If the
13      *       target thread waits for long periods (on a condition variable,
14      *       for example), the <code>interrupt</code> method should be used to
15      *       interrupt the wait.
16      *       For more information, see
17      *       <a href="{@docRoot}/../technotes/guides/concurrency/threadPrimitiveDeprecation.html">Why
18      *       are Thread.stop, Thread.suspend and Thread.resume Deprecated?</a>.
19      */
20     @Deprecated
21     public final void stop() 

 

直接调用Thread的stop()方法,将不理会原来所设定的释放、取得锁定流程,会直接释放所有已锁定对象,这有可能使对象陷入无法预期的状态。如果要停止线程,最好自行操作,让线程跑完所有的流程,合理地进入Dead状态。

 

除了stop()方法外,Thread的rerume()、suspend()、destroy()等方法也不建议再使用。更合理的做法是正确地设计你的线程,不要采用这种“走捷径”的粗暴方法。

 

3.4 线程小结

多线程其实并不是真正意义上的并发,只是一种更高效率地利用CPU的手段。就像我们可以在烧水的时候拿茶叶,在煮茶的时候拿快递,但是不可能在开煤气的同时还能去开茶叶罐,也不可能在把茶叶放进茶壶的同时去开门。在程序开发当中,多线程是提高效率的常用手段之一。

 

实现多线程有两种方式,一是直接继承Thread类,二是实现Runnable接口。根据不同的需求和情况,我们可以选择更合适的方法。要想做到因时制宜,必须要做到对各方面都了解的程度。

 

线程什么时候创建,什么时候启动,什么时候运行,什么时候挂起,什么时候终止··· ···这些统称为线程的生命周期。掌握线程的生命周期,就等于掌握了线程,让其更符合程序员的设计运作。

 

 

 

 

相关文章推荐:

JavaSE中Collection集合框架学习笔记(1)——具有索引的List

JavaSE中Collection集合框架学习笔记(2)——拒绝重复内容的Set和支持队列操作的Queue

JavaSE中Collection集合框架学习笔记(3)——遍历对象的Iterator和收集对象后的排序 

JavaSE中Map框架学习笔记 

 

如果你喜欢我的文章,可以扫描关注我的个人公众号“李文业的思考笔记”。

不定期地会推送我的原创思考文章。

 

 

posted @ 2017-07-21 09:01  LevenYes  阅读(646)  评论(4编辑  收藏  举报