进程、线程与协程的比较

概念

并行和并发

在介绍进程、线程和协程这三个概念之前,有两个操作系统中的相关概念需要简单解释一下:并行和并发。

  • 并行:指多个任务同时执行。
  • 并发:指在一个时间段内,多个程序都是在同一个处理机上运行,但任一个时刻点上只有一个程序在处理机上运行(即多个任务在同一处理机上交替执行)。

对单核CPU,因为一个CPU一次只能执行一条指令,是无法做到并行,只能做到并发。

进程

一个进程就是一个具有独立功能的应用程序,关于某个数据集合上的一次运行活动。

进程是系统进行资源分配和调度的一个独立单位。

优点:相对比较稳定安全(进程拥有独立的系统资源,进程间不容易相互影响)

缺点:

  • 进程切换的时空开销比较大(涉及到很多系统资源的切换)
  • 进程间通信(IPC)较为复杂和耗时

线程

线程是进程的实体,属于进程,是CPU调度和分派的基本单位,CPU将资源分配给进程,所有线程共享该进程的资源。一个tomcat对应一个进程,访问 tomcat下的应用的时候,就是一个启动线程。

优点:线程切换的开销比进程切换的开销小,减少了任务切换的消耗,提高了操作系统的并发性能。

缺点:相比进程不够稳定,多线程在操作共享数据时容易出错(比如丢失数据、产生死锁)

任务调度

大部分操作系统的任务调度是采用时间片轮转的抢占式调度方式,也就是说一个任务执行一小段时间后强制暂停去执行下一个任务,每个任务轮流执行。任务执行的一小段时间叫做时间片,任务正在执行时的状态叫运行状态,任务执行一段时间后强制暂停去执行下一个任务,被暂停的任务就处于就绪状态,等待下一个属于它的时间片的到来。这样每个任务都能得到执行,由于CPU的执行效率非常高,时间片非常短,在各个任务之间快速地切换,给人的感觉就是多个任务在“同时进行”,这也就是我们所说的并发。

协程

即在单线程里多个函数并发地执行。

协程是一种用户态的轻量级线程,协程的调度完全由用户控制。

从技术的角度来说,“协程就是你可以暂停执行的函数”。协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文的切换非常快。

协程不需要多线程的锁机制。在协程中控制共享资源不加锁,只需要判断状态就好了。

协程有主要以下特性:

  • 协作式调度模式(即协程IO时,会主动让出CPU资源给其他协程,等IO完在执行,所以协程是没有IO耗时的)
  • 同一时间,只有一个协程在运行(主要是协程底层实现和线程相似)

进程与线程的区别

  1. 线程是程序执行的最小单位,而进程是操作系统分配资源的最小单位;
  2. 一个进程由一个或多个线程组成,线程是一个进程中代码的不同执行路线;
  3. 进程之间相互独立,但同一进程下的各个线程之间共享程序的内存空间(包括代码段,数据集,堆等)及一些进程级的资源(如打开文件和信号等),某进程内的线程在其他进程不可见
  4. 调度和切换:线程上下文切换比进程上下文切换要快得多

协程与线程的区别

  1. 线程是操作系统调度,协程是用户态调度。
  2. 一个线程可以多个协程,一个进程也可以单独拥有多个协程。
  3. 协程能保留上一次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态。
  4. 线程是抢占式,而协程是非抢占式的,所以需要用户自己释放使用权来切换到其他协程,因此同一时间其实只有一个协程拥有运行权,相当于单线程的能力。
  5. 协程并不是取代线程, 而且抽象于线程之上, 线程是被分割的CPU资源, 协程是组织好的代码流程, 协程需要线程来承载运行, 线程是协程的资源, 但协程不会直接使用线程, 协程直接利用的是执行器(Interceptor), 执行器可以关联任意线程或线程池, 可以使当前线程, UI线程, 或新建新程.。
  6. 线程是协程的资源。协程通过Interceptor来间接使用线程这个资源