《操作系统导论》读书笔记1——CPU虚拟化，进程

技术分享 2年前 (2023-03-21) 0 999+

一丶CPU的虚拟化

一个桃子，我们称之为物理（physical）桃子。但有很多想吃这个桃子的人，我们希望向每个想吃的人提供一个属于他的桃子，这样才能皆大欢喜。我们把给每个人的桃子称为虚拟（virtual）桃子。我们通过某种方式，从这个物理桃子创造出许多虚拟桃子。重要的是，在这种假象中，每个人看起来都有一个物理桃子，但实际上不是。

以最基本的计算机资源 CPU 为例，假设一个计算机只有一个 CPU（尽管现代计算机一般拥有 2 个、4 个或者更多 CPU），虚拟化要做的就是将这个 CPU 虚拟成多个虚拟 CPU 并分给每一个进程使用，因此，每个应用都以为自己在独占 CPU，但实际上只有一个 CPU。这便是CPU的虚拟化

二丶进程

1.概念

进程就是运行中的程序。程序本身是没有生命周期的，它只是存在磁盘上面的一些指令（也可能是一些静态数据）。是操作系统让这些字节运行起来，让程序发挥作用。

2.进程的机器状态

程序在运行时可以读取或更新的内容。在任何时刻，机器的哪些部分对执行该程序很重要（进程执行过程中会使用到机器的哪些部分）

内存

指令存在内存中。正在运行的程序读取和写入的数据也在内存中。因此进程可以访问的内存（称为地址空间，address space）是该进程的一部分
寄存器

许多指令明确地读取或更新寄存器
程序计数器

代表程序当前正在执行哪个指令；类似地，栈指针（stack pointer）和相关的帧指针（frame pointer）用于管理函数参数栈、局部变量和返回地址。
持久存储设备

此类 I/O 信息可能包含当前打开的文件列表

3.时分共享

通过让一个进程只运行一个时间片，然后切换到其他进程，操作系统提供了存在多个虚拟 CPU 的假象。这就是时分共享（time sharing）CPU 技术。

磁盘空间是一个空分共享资源，因为一旦将块分配给文件，在用户删除文件之前，不可能将它分配给其他文件。

4.程序如何转化为进程

操作系统如何启动并运行一个程序？进程创建实际如何进行？

程序最初以某种可执行格式驻留在磁盘上

操作系统需要将代码和所有静态数据（例如初始化变量）加载（load）到内存中，加载到进程的地址空间中
为进程分配空间

为程序的运行时栈分配一些内存。程序使用栈存放局部变量、函数参数和返回地址。操作系统分配这些内存，并提供给进程。
为程序的堆分配一些内存

C语言程序通过调用 malloc()来请求这样的空间
其他初始化任务

如在UNIX系统中，默认情况下每个进程都有 3 个打开的文件描述符（file descriptor），用于标准输入、输出和错误。这些描述符让程序轻松读取来自终端的输入以及打印输出到屏幕。

操作系统需要初始化这三个文件描述符

5.进程的状态

运行

在运行状态下，进程正在处理器上运行。这意味着它正在执行指令。

就绪

在就绪状态下，进程已准备好运行,但没有被CPU进行调度

阻塞

在阻塞状态下，一个进程执行了某种操作，直到发生其他事件时才会准备运行。一个常见的例子是，当进程向磁盘发起 I/O 请求时，它会被阻塞，因此其他进程可以使用处理器。

为了跟踪每个进程的状态，操作系统使用进程列表，跟踪当前正在运行的进程的一些附加信息。操作系统还必须以某种方式跟踪被阻塞的进程(当 I/O 事件完成时，操作系统应确保唤醒正确的进程，让它准备好再次运行)

对于停止的进程，寄存器上下文将保存其寄存器的内容。当一个进程停止时，它的寄存器将被保存到这个内存位置。通过恢复这些寄存器（将它们的值放回实际的物理寄存器中），操作系统实现恢复运行该进程。

僵尸状态:一个进程处于已退出但尚未清理的最终状态。其他进程（通常是创建进程的父进程）可以检查僵尸进程的返回代码，并查看刚刚完成的进程是否成功执行。

6.进程API

6.1.fork

调用fork函数，父进程fork函数返回的是子进程的进程id，子进程将返回0，如果返回小于0的数表示fork失败。

6.2.exec

使用exec系统调用，需要给定可执行程序的名称以及需要的参数，随后exec将从可执行程序中加载代码和静态数据，并用它复写自己的代码段，静态数据，堆，栈以及其他内存空间也会被重新初始化，然后操作系统就执行该程序。

因此exec()并没有创建新进程，而是直接将运行的程序替换成另一个程序。

6.4.wait

父进程调用 wait()，延迟自己的执行，直到子进程执行完毕。当子进程结束时，父进程才从wait返回。

三丶进程的调度

为了虚拟化 CPU，操作系统需要以某种方式让许多进程共享物理 CPU，让它们看起来像是同时运行。操作系统使用时分共享：运行一个进程一段时间，然后运行另一个进程实现cpu的虚拟化。

实现时分共享面临的挑战：

性能

如何在不增加系统开销的情况下，实现虚拟化cpu
控制权

如何有效地运行进程，同时保留对 CPU 的控制？控制权对于操作系统尤为重要，因为操作系统负责资源管理。如果没有控制权，一个进程可以简单地无限制运行并接管机器，或访问没有权限的信息。因此，在保持控制权的同时获得高性能，这是构建操作系统的主要挑战之一。

1.用户态/内核态

用户模式

此模式下运行的代码会受到限制。例如，在用户模式下运行时，进程不能发出 I/O 请求。这样做会导致处理器引发异常，操作系统可能会终止进程。

应用程序在用户态下无法完全的访问硬件资源。
内核模式

与用户模式不同的内核模式，操作系统（或内核）就以这种模式运行。在此模式下操作系统可以访问机器的全部资源。

如果用户态的进程希望执行一些特权操作（比如读取磁盘），那么需要执行操作系统向外提供的系统调用。

要执行系统调用，程序必须执行特殊的陷阱指令。执行陷阱指令可以切换到内核态，完成指令后，操作系统将调用一个特殊的从陷阱返回指令，该指令会返回到发起调用的用户程序中，同时将特权级别降低，回到用户模式。

在 x86 上执行陷阱指令时，处理器会将程序计数器、标志和其他一些寄存器中的信息保存到每个进程的内核栈上。从陷阱中返回时将从栈弹出这些值，并恢复执行用户模式程序。

2.进程切换

2.1 协作和抢占

协作模式

操作系统相信系统的进程会合理运行。运行时间过长的进程被假定会定期放弃 CPU，以便操作系统可以决定运行其他任务。

进程通过调用系统调用的方式将cpu控制权转移给操作系统，例如使用yield系统调用。
抢占模式

操心系统通过时钟中断,时钟设备可以编程为每隔几毫秒产生一次中断。产生中断时，当前正在运行的进程停止，操作系统中预先配置的中断处理程序会运行。此时，操作系统重新获得 CPU 的控制权，可以进行进程切换。