线程 进程 多线程 多进程
进程和线程的主要区别在于多进程每个进程拥有独立存储空间,而多线程共享存储空间。对于单核CPU来讲,如果是阻塞操作,或者不耗时非阻塞操作,多进程/线程不会提高效率,这时候多进程/线程最有用的通常是耗时而又非阻塞的I/O操作。
打个比喻,一个人要看两部电影,可以看完一部再看另一部,也可以同时看,看一眼这个暂停,看一眼那个再暂停看回前一个,快速不停切换,你会觉得因为两部一起看所以先看完吗?理论上两部电影播放时间加起来是一样,所以看完所用时间应该一样。但是实际使用时间反而可能第一种方法快,为什么?切换是有开销的,下次切换回来你的大脑起码要花点时间快速回忆一下才能接下去看吧。这跟多线/进程是一个道理,CPU进行线/进程切换是有开销的,进程切换开销大于线程切换。
I/O操作可以想像成煮饭,煲汤之类的工作,耗时但不用你时刻盯着,而且这期间你仍可以做其他事情。这个时候煮饭和煲汤同时做就比做完一个再做另一个快多了。
再说多核CPU,当线程/进程数达到CPU数量时,道理就跟单核CPU一样了,继续增加线/进程数也无法提高效率,除非是大量耗时非阻塞的I/O操作(例如文件读写,数据库读写,网络请求等)
当系统CPU是多核的时候比较单线/进程和多线/进程是没有意义的,多人干活肯定比一个人快。
多线程的难点是线程同步和线程安全。多进程由于不能共享资源,需要考虑进程间通信问题。
所以使用单线/进程还是多线/进程完全取决于你的应用场景,没有统一答案。这从不同的语言平台使用不同的策略可以看出来,java允许编程人员创建多线程,但javascript/node.js是单线程异步策略,python(cpython解释器)设定了GIL全局锁,实质上也是单线程的。它们之间孰优孰劣?恐怕永远不能争出一个绝对答案。这些语言都支持多进程以便充分利用多核CPU。
以上纯个人理解。
Email: chrischjh@gmail.com