现在不要担心理解上面的图片,因为我们将从非常基础的知识开始。
Goroutines分布在线程中,由Goroutine调度器在幕后处理。根据我们之前的讨论,我们知道一些关于Goroutines的事情:
- 从原始执行速度来看,Goroutines不一定比线程更快,因为它们需要一个实际的线程来运行。
- Goroutines的真正优势在于上下文切换、内存占用、创建和拆除的成本等方面。
你可能之前听说过Goroutine调度器,但我们真正了解它是如何工作的吗?它是如何将Goroutines与线程配对的?
现在让我们一步一步地分解调度器的操作。
一、Goroutine的M:N调度器
Go团队为我们真正简化了并发处理,想想看:创建一个Goroutine就像在函数前面加上go关键字一样容易。
go doWork()
但在这个简单的步骤背后,有一个更深层的系统在运作。
从一开始,Go并不是简单地提供了线程。相反,在中间有一个辅助工具,Goroutine调度器,它是Go运行时的关键部分。
1*6UyqGhkbOV7kSlRe1CD-gA.png
那么什么是M:N标签?
它表示Go调度器在将M个Goroutines映射到N个内核线程时所起的作用,形成了M:N模型。你可以拥有更多的操作系统线程,就像可以拥有更多的Goroutines一样。
在我们深入研究调度器之前,让我们澄清一下经常混淆的两个术语:并发和并行。
- 并发:这是关于同时处理多个任务,它们都在运动,但不总是在同一时刻。
- 并行:这意味着许多任务在完全相同的时间运行,通常使用多个CPU核心。
1*30ViMAPkVySvdSDc-hI3sA.png
让我们看看Go调度器是如何与线程配合运作的。
二、PMG 模型
在我们深入研究内部工作原理之前,让我们分解一下P、M和G代表什么。
1.G(Goroutine)
Goroutine充当Go的最小执行单元,类似于轻量级线程。
在Go的运行时中,它由一个名为g的struct{}表示。一旦创建,它会找到一个逻辑处理器P的本地可运行队列(或G队列)中的位置,然后P将其交给一个实际的内核线程M。
Goroutines通常存在三种主要状态:
- 等待:在这个阶段,Goroutine停滞不前,可能因为通道或锁之类的操作而暂停,或者可能被系统调用暂停。
- 可运行:Goroutine已经准备好运行,但尚未开始运行,它正在等待轮到它在一个线程(M)上运行。
- 运行:现在,Goroutine正在一个线程(M)上积极执行。它会一直执行,直到任务完成,除非调度器中断它或其他原因阻止了它的执行。
1*U62eyES6_koQtsv_9jWKHw.png
Goroutines并不仅仅被使用一次然后被丢弃。
相反,当启动新的Goroutine时,Go的运行时会从Goroutine池
中选择一个,但如果找不到任何可用的Goroutine,它会创建一个新的。然后,这个新的Goroutine加入到一个P的可运行队列中。
2.P(逻辑处理器)
在Go调度器中,当我们提到“处理器”时,我们指的是逻辑实体,而不是物理实体。
默认情况下,P的数量设置为可用的核心数,你可以使用runtime.GOMAXPROCS(int)函数来检查或更改这些处理器的数量。
runtime.GOMAXPROCS(0) // 获取当前允许的逻辑处理器数量
如果你想更改这个数量,最好是在应用程序启动时更改它,如果在运行时更改,它会导致STW(停止一切),直到重新调整处理器。
每个P都拥有自己的可运行Goroutines列表,称为本地运行队列,最多可以容纳256个Goroutines。
1*0EneA397HA1uYYeg0_HspQ.png
调度器 — P(逻辑处理器)
如果P的队列达到了最大Coroutines数(256),那么就有一个共享队列,称为全局运行队列,但我们将稍后讨论这个。
"那么 'P' 的这个数量到底代表什么?" 它表示可以同时运行的Goroutines数量 — 想象它们并行运行。
3.M(机器线程 — 操作系统线程)
一个典型的Go程序最多可以使用1万个线程。
是的,我说的是线程,而不是Goroutines。如果超出这个限制,你可能会使你的Go应用程序崩溃。
"什么情况下会创建一个线程?" 想象一种情况:一个Goroutine处于可运行状态并需要一个线程。如果所有线程已经被阻塞,可能是因为系统调用或非抢占操作,会怎么样?在这种情况下,调度器会介入并为该Goroutine创建一个新线程。一个需要注意的事情是,如果一个线程只是忙于昂贵的计算或长时间运行的任务,它不被视为被卡住或被阻塞。如果你想更改默认线程限制,你可以使用runtime/debug.SetMaxThreads()函数,它允许你设置你的Go程序可以使用的操作系统线程的最大数量。此外,值得知道的是,线程是可以重复使用的,因为创建或销毁线程是消耗资源的。
三、MPG 工作原理
让我们通过项目符号逐步了解 M、P 和 G 如何一起运作。
我不会在这里深入讨论每个细节,但我将在即将发布的故事中深入探讨。如果你感兴趣,请订阅。
1*d4hu416FJtHHaJaKJFYkGg.png
1.Go Scheduler 的工作原理:
- 初始化 goroutine:通过使用go func()命令,Go Runtime 要么创建一个新的 goroutine,要么从池中选择一个现有的。
- 排队位置:goroutine 寻找其在队列中的位置,如果所有逻辑处理器(P)的本地队列都满了,那么这个 goroutine 就被放入全局队列。
- 线程配对:这是 M 开始发挥作用的地方。它获取一个 P 并开始处理来自 P 本地队列的 goroutine,当 M 与这个 goroutine 交互时,与之关联的 P 就变得占用,不再可用于其他 M。
- 窃取行为:如果某个 P 的队列被耗尽,M 会尝试“借用”另一个 P 队列中一半可运行的 goroutine。如果不成功,它然后检查全局队列,然后再检查网络轮询器(请查看下面的“窃取过程”图表部分)。
- 资源分配:M 选择了一个 goroutine(G)之后,它会获取运行 G 所需的所有资源。“那么被阻塞的线程呢?” 如果一个 goroutine 启动了需要时间的系统调用(比如读取文件),那么 M 会等待。但调度程序不喜欢某个只是坐在那里等待的线程,它会将被暂停的 M 与其 P 解除连接,并将来自队列的另一个可运行的 goroutine 与新的或现有的 M 连接起来,然后与 P 协作。
2.被阻塞的线程
窃取过程:
当一个线程(M)完成了它的任务并没有其他事情可做时,它不会坐在那里。
相反,它积极地寻找更多工作,观察其他处理器并获取它们一半的任务,让我们来详细了解一下:
ewA.png
- 每 61 个时钟滴答,M 检查全局可运行队列,以确保执行的公平性。如果在全局队列中找到一个可运行的 goroutine,就停止。
- 然后,线程 M 检查其本地运行队列,与其处理器 P 相关联,以查看是否有可运行的 goroutine 可以处理。
- 如果线程发现它的队列是空的,那么它会查看全局队列,看看那里是否有等待处理的任务。
- 然后,线程会检查网络轮询器,以查看是否有与网络相关的任务。
- 如果线程在检查了网络轮询器后仍然没有找到任务,它将进入主动搜索模式,我们可以将其视为旋转状态。
- 在这种状态下,线程试图从其他处理器的队列中“借用”任务。
- 经过所有这些步骤后,如果线程仍然找不到工作,它将停止主动搜索。
- 现在,如果有新的任务进来,而且有一个没有在搜索状态的空闲处理器,那么可以提示另一个线程开始工作。
需要注意的细节是全局队列实际上被检查了两次:每 61 个时钟滴答一次以确保公平性,如果本地队列为空,就再次检查。
“如果 M 与其 P 相关联,它怎么能从其他处理器那里获取任务呢?M 会更改其 P 吗?” 答案是不会。即使 M 从另一个 P 的队列中获取任务,它仍然使用其原始处理器来运行该任务。因此,在 M 承担新任务的同时,它仍然忠实于其处理器。
“为什么是 61?” 在设计算法时,特别是哈希算法,通常会选择质数,因为它们除了 1 和它们自己之外没有除数。这可以降低出现模式或规律的机会,从而防止“碰撞”或其他不希望出现的行为。如果太短,系统可能会浪费资源频繁检查全局运行队列。如果太长,goroutine 可能会在执行之前等待过长的时间。
3.网络轮询器
我们还没有详细讨论网络轮询器,但它在窃取过程图表中提到了。
与 Go Scheduler 一样,网络轮询器是 Go Runtime 的组成部分,负责处理与网络相关的调用(例如,网络 I/O)。
让我们比较两种系统调用类型:
- 与网络相关的系统调用:当一个 goroutine 执行网络 I/O 操作时,它不会阻塞线程,而是会在网络轮询器中注册。轮询器会异步等待操作完成,一旦完成,goroutine 就会再次可运行,可以在一个线程上继续执行。
- 其他系统调用:如果它们可能会阻塞并且不由网络轮询器处理,它们可能会导致 goroutine 将其执行卸载到操作系统线程上。只有特定的操作系统线程会被阻塞,Go 运行时调度程序可以在不同线程上执行其他 goroutine。