当你打开终端并输入命令时会发生什么?

哈喽大家好，我是咸鱼

参加过校招面试的小伙伴们肯定对下面这道面试题很熟悉：“当你在浏览器输入一段网址后会发生什么？”。这道面试题可以说是很经典了，因为其涉及大量网络协议，可以非常直观的看出小伙伴们对计算机网络体系的整体把握程度

但如果问题换成：“当你打开终端并输入ls时会发生什么？”，有多少小伙伴能够回答出来呢？

终端的前世今生

大多数现代终端应用程序的工作方式都来自于其历史前辈——电传打字机（teletypes，简称 tty）

在大型计算机的时代，当时数据存储在磁带上，计算机的内存以 kB 为单位，电传打字机就是为了它们而被设计出来

当你打开终端并输入命令时会发生什么? 图片

左边的是 IBM 2741电传打字机，右边是 IBM System/360 Mo. 40大型计算机

电传打字机是允许用户与计算机交互的基本文本客户端。teletypes 其实是 teletypewriter的缩写，因为它是从打字机（typewriters）演变过来的

如上图所示，电传打字机和大型计算机通过连接两端的物理线来进行通信。沟通过程如下：

当用户从电传打字机输入时，ASCII 文本将一个字符一个字符地通过网络传输
计算机的内核接收字符并对其进行解码
接着字符被送到一个名为TTY driver的驱动程序，这里负责将输入发送到用户程序并收集输出
最后，内核将输出发送回电传打字机，以便显示给用户

需要提到的一点是line discipline（行规则），它会将字符缓冲到内核内存中，直到按下 Enter键，程序才会接收到输入

line discipline 允许这块缓冲区是可编辑的，并提供了一些与程序无关的快捷键（例如 ctrl-w）

这在当时是一项重要的性能优化，因为让程序员一个字符一个字符的处理是非常低效的

随着计算技术的进步，这些独立组件中的许多都实现了现代化。比如说电传打字机被终端所取代，终端是完全电子的机器，包括电子显示器

当你打开终端并输入命令时会发生什么? 图片

DEC 于 1978 年发布的 VT100 终端机（VT = video terminal），它实现并推广了至今仍在使用的 ANSI 转义码

随着电子终端的诞生，出现了越来越多的功能（例如颜色、铃声）。但本质上跟电传打字机完全相同——发送输入字符流并显示输出

现如今人人都有一台自己的电脑，这些电脑的操作系统可以监督许多应用程序，终端不再是专门的硬件，而是变成了这些应用程序中的一个

当你打开终端并输入命令时会发生什么? 图片

与典型的 GUI 应用程序一样，终端是操作系统监督下的一个进程，它监听来自用户的事件和输入，并告诉操作系统在窗口中显示什么（终端不直接与外设交互，而是通过驱动程序和窗口管理器）

有时候我们还会听到 ”终端模拟器“ 这个词，而不是简单的称之为 ”终端“。这是因为 ”终端“ 指的是专门的硬件（终端机），而现在大多数的终端只是对该设备的模拟，是一个应用程序

但是我们这里不做区分，下文提到的“终端”等同于“终端模拟器”

那么当我们打开终端时会发生什么呢？

打开终端

上面我们提到过，终端是一个应用程序，能够让你 ”使用你的电脑“（即在上面运行程序）。我们的电脑上可能已经存在了ls、rm、mv等程序

但是我们不满足于使用这些简单的命令，我们还希望使用脚本来实现自动化，这些脚本将许多命令的序列组合在一起，使用分支条件逻辑，运行重复循环或并行化命令等

为了让计算机能够读懂我们的脚本并执行起来，我们需要一个完整的可交互的解释型的编程环境——shell

将其他程序作为进程运行，让操作系统内核读懂你写的脚本，这些工作都由 shell 完成。目前常见的 shell 有 Bash、Zsh 等

终端和 shell 是两个独立的程序：

shell 负责解释你输入的命令
终端负责 UI 相关的东西，比如字体、颜色等

简单来讲，当我们打开终端时，终端会根据用户生成一个 shell 进程，以及用户与 shell 之间，用户与 shell 启动的进程之间通信的方法

这个 shell 进程负责解释和执行用户输入的命令，并与用户进行交互。用户在终端输入的命令将通过这个通信通道传递给 shell 进程进行解释执行，并将执行结果反馈给用户显示在终端上

创建 PTY

伪终端设备（PTY）是在计算机操作系统中创建的一个虚拟设备，用于模拟物理终端的功能

在 UNIX、Linux 和类 UNIX系统中，PTY 用于在用户和程序之间建立一个通信通道，允许用户通过终端会话与程序进行交互

PTY通常由两个主要部分组成：主设备（leader）和从设备（follower）。leader端连接到用户终端，follower端连接到一个或多个程序

当你打开终端并输入命令时会发生什么? 图片

当用户打开终端并启动一个 shell 时，终端模拟器会创建一个 PTY，并将leader端连接到用户界面，同时将follower端连接到 shell 或其他命令行程序

用户输入的命令通过leader端传输到follower端，follower端执行这些命令并将输出发送回leader端，最终显示在用户界面上

在 Unix 中，一切皆文件，这句话指的是 Unix 中的所有东西都有与文件相同的读/写接口。

leader 的 fd（文件描述符）指向内存中的一个缓冲区，而 follower 是一个在磁盘上具有实际路径的字符设备文件

当你打开终端并输入命令时会发生什么? 图片

上图可以看到，我们打开了两个终端（/dev/pts/0、/dev/pts/1），启动了两个 shell 进程。如果我们在终端 1（/dev/pts/1）中敲命令并重定向到终端0（/dev/pts/0），可以看到输出结果是在终端0 中显示的

生成 shell

终端会话在启动时可能会为shell创建一个子进程，这个子进程将作为 shell 的实例来执行用户的命令

UNIX 和类 UNIX 系统中，终端会话会使用伪终端设备（PTY）来与shell 进程进行通信，通过这种方式，终端会话可以读取和写入 shell 的输入、输出和错误输出（fd 0到2）

这样使得用户在终端输入的命令可以被Shell 进程解释执行，并且 Shell进程的输出可以在终端显示

当你打开终端并输入命令时会发生什么? 图片

shell 初始化

在Linux 中，用户打开终端启动 shell 进程时会进行 shell 初始化，这个过程涉及一些配置文件和脚本的执行，用来设置用户的环境和启动 shell 的行为

步骤大致如下：

读取配置文件：在用户登录时，shell 会读取一系列的配置文件来设置用户的环境变量、别名、函数等。这些配置文件可以包括全局配置文件（例如/etc/profile）和用户特定的配置文件（例如~/.bash_profile、~/.bashrc等）
执行配置命令：配置文件中可以包含各种设置和命令，例如设置环境变量、修改提示符、定义别名和函数等。这些命令会在 shell 启动时执行，以确保在用户登录后设置了所需的环境和行为
启动shell：一旦执行了配置文件中的命令，shell 就会准备就绪，等待用户的输入。这时，shell 的提示符会出现，等待用户输入命令