task_struct结构体是Linux下的进程控制块PCB,PCB里包含着一个进程的所有信息。
要了解task_struct结构体,就必须要知道什么是进程。进程可以有以下几个定义:
一个正在执行的程序。
一个正在计算机上执行的程序实例。
能分配给处理器并由处理器执行的实体。
一个具有以下特征的活动单元:一组指令序列的执行、一个当前状态和相关的系统资源集合。
也可以把进程当成由一组元素组成的实体,进程的两个基本元素是程序代码(可能被执行相同程序的其他进程共享)和与代码相关联的数据集。假设处理器开始执行该程序代码,且我们把这个执行实体称为进程。在进程执行时,任意给的一个时间,进程都可以唯一地被表征为以下元素:
前述的列表信息被存放在一个称为进程控制块(PCB)的数据结构中,该控制块由操作系统创建和管理。
要了解PCB,就需要知道操作系统执行一个程序的过程,如下图:
进程是动态运行的事例,但是并不是所有的进程都在运行,详情可以参考我写的另外一篇博客:进程的调度算法
https://blog.csdn.net/qq_41209741/article/details/82866480
每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,在Linux下内核的进程控制块就是task_struct结构体。
task_struct结构体是Linux内核中的一种数据结构,接下来就进入本文的重点:剖析task_struct结构体
(1)进程的标识 PID(process identifier):
32位无符号整型数据。但最大值取32767。表示每一个进程的标识符。也是内核提供给用户程序的借口,用户程序通过pid操作程序。因为Unix的原因引入还引入了线程组的概念。称为:tgid。一个线程组中的所有线程使用和该线程组中的第一个轻量级线程的pid,被存在tgid成员中。当进程没有线程时,tgid=pid;当有多线程时,tgid表示的是主线程的id,而pid表示每一个线程自己的id。
(2)进程的状态 volatile long state
state的可能取值是:
#define TASK_RUNNING 0//进程要么正在执行,要么准备执行
#define TASK_INTERRUPTIBLE 1 //可中断的睡眠,可以通过一个信号唤醒
#define TASK_UNINTERRUPTIBLE 2 //不可中断睡眠,不可以通过信号进行唤醒
#define __TASK_STOPPED 4 //进程停止执行
#define __TASK_TRACED 8 //进程被追踪
/* in tsk->exit_state */
#define EXIT_ZOMBIE 16 //僵尸状态的进程,表示进程被终止,但是父进程还没有获取它的终止信息,比如进程有没有执行完等信息。
#define EXIT_DEAD 32 //进程的最终状态,进程死亡
/* in tsk->state again */
#define TASK_DEAD 64 //死亡
#define TASK_WAKEKILL 128 //唤醒并杀死的进程
#define TASK_WAKING 256 //唤醒进程
(3)进程的优先级 long priority
Priority的值给出进程每次获取CPU后可使用的时间(按jiffies计)。优先级可通过系统sys_setpriorty改变(在kernel/sys.c中)。
(4)进程调度信息
表示当前进程或一个进程允许运行的时间,待到该进程的时间片运行结束,CPU会从运行队列上拿出另一个进程运行。
(5)进程通信有关信息(IPC:Inter_Process Communication)
(6)进程信息
Linux中存在多进程,而多进程中进程之间的关系可能是父子关系,兄弟关系。
除了祖先进程外,其他进程都有一个父进程,通过folk创建出子进程来执行程序。除了表示各自的pid外,子进程的绝大多数信息都是拷贝父进程的信息。且父进程对子进程手握生杀大权,即子进程时是父进程创建出来的,而父进程也可以发送命令杀死子进程。
(7)时间信息
(8)文件信息
文件的打开和关闭都是资源的一种操作,Linux中的task_struct中有两个结构体储存这两个信息。
Sruct fs_struct *fs:进程的可执行映象所在的文件系统,有两个索引点,称为root和pwd,分别指向对应的根目录和当前目录。
Struct files_struct *files:进程打开的文件
(8)地址空间/虚拟内存信息
每个进程都有自己的一块虚拟内存空间,用mm_struct来表示,mm_struct中使用两个指针表示一段虚拟地址空间,然后在最终时通过页表映射到真正的物理内存上。
(9)页面管理信息
(10)对称对处理机信息
(11)上下文信息:
(12)信号量数据成员
(13)进程队列指针
以上分别是指向原始父进程(original parent)、父进程(parent)、子进程(youngest child)及新老兄弟进程(younger sibling,older sibling)的指针。