[rCore学习笔记 024]多道程序与协作式调度

腥狩频 发表于 2025-6-8 12:49:50

写在前面

本随笔是非常菜的菜鸡写的。如有问题请及时提出。
可以联系：1160712160@qq.com
GitHhub：https://github.com/WindDevil （目前啥也没有
本节重点

主要是对任务的概念进行进一步扩展和延伸：形成

[*]任务运行状态：任务从开始到结束执行过程中所处的不同运行状态：未初始化、准备执行、正在执行、已退出
[*]任务控制块：管理程序的执行过程的任务上下文，控制程序的执行与暂停
[*]任务相关系统调用：应用程序和操作系统之间的接口，用于程序主动暂停 sys_yield 和主动退出 sys_exit
这里主要看具体实现,这些概念之前学习RTOS的时候使用是会使用了,但是具体怎么实现还不好说.
多道程序背景与 yield 系统调用

尽管 CPU 可以一直在跑应用了,但是其利用率仍有上升的空间.
随着应用需求的不断复杂,有的时候会在内核的监督下访问一些外设,它们也是计算机系统的另一个非常重要的组成部分,即输入/输出 (I/O, Input/Output) .
CPU 会把 I/O 请求传递给外设,待外设处理完毕之后,CPU 便可以从外设读到其发出的 I/O 请求的处理结果.
我们暂时考虑 CPU 只能单向地通过读取外设提供的寄存器信息来获取外设处理 I/O 的完成状态。
多道程序的思想在于:

[*]内核同时管理多个应用。如果外设处理 I/O 的时间足够长，那我们可以先进行任务切换去执行其他应用
[*]在某次切换回来之后，应用再次读取设备寄存器，发现 I/O 请求已经处理完毕了，那么就可以根据返回的 I/O 结果继续向下执行了
这样的话，只要同时存在的应用足够多，就能一定程度上隐藏 I/O 外设处理相对于 CPU 的延迟，保证 CPU 不必浪费时间在等待外设上，而是几乎一直在进行计算。
这种任务切换，是让应用主动调用 sys_yield 系统调用来实现的，这意味着应用主动交出 CPU 的使用权给其他应用。
这一段的描述相当是一种多任务的轮询,但是在我的脑海中, 外部中断还是比多任务轮询要好得多的. 但是怎么合理地利用外部中断提高实时性,就是一个问题.
至于主动调用sys_yield就是一件很难的事情,也就是为啥叫做协作式 , 就是系统的性能要依赖程序员在设计APP的时候释放CPU.(我自己都想拉满CPU,谁想管你死活捏)
这里提到了一种多道程序执行的典型情况 :

这张图很好解释:

[*]这张图的横轴是时间轴
[*]这张图的纵轴是运行实体(任务和IO硬件)
[*]可以看到是有三个运行实体
[*]I/O Device : 这个是IO硬件
[*]I/O Task : 这个是请求IO硬件的任务
[*]Other Task : 这个是不请求IO硬件的其它任务

[*]可以看到最开始是 IO Task 在运行.
[*]在 I/O Start yield 时刻,IO Task 请求了IO硬件,然后释放了CPU.
[*]Other Task 接手CPU,同时 IO Device 继续处理硬件上的问题.
[*]一直执行到 Not Complete yileld again 时段的开头,Other Task 执行完毕,把CPU释放.
[*]由 IO Task 接手之后检查IO硬件状态,仍然没有处理完毕.
[*]在 Not Complete yileld again 时段的结尾, IO Task 释放CPU.
[*]Other Task 再次接手CPU,同时 IO Device 继续处理硬件上的问题.
[*]在 Other Task 执行期间,发生了 I/O Complete 时刻,但是此时软件感知不到.
[*]在 Continue 时刻, ,Other Task 执行完毕,把CPU释放.
[*]由 IO Task 接手之后检查IO硬件状态,处理完毕,因此继续执行.
上面我们是通过“避免无谓的外设等待来提高 CPU 利用率”这一切入点来引入 sys_yield 。但其实调用 sys_yield 不一定与外设有关。随着内核功能的逐渐复杂，我们还会遇到其他需要等待的事件，我们都可以立即调用 sys_yield 来避免等待过程造成的浪费。
sys_yield 的缺点

这一部分和我最开始考虑的关于实时性问题的思考是有一定关联的.
当应用调用它主动交出 CPU 使用权之后，它下一次再被允许使用 CPU 的时间点与内核的调度策略与当前的总体应用执行情况有关，很有可能远远迟于该应用等待的事件（如外设处理完请求）达成的时间点。这就会造成该应用的响应延迟不稳定或者很长。比如，设想一下，敲击键盘之后隔了数分钟之后才能在屏幕上看到字符，这已经超出了人类所能忍受的范畴。但也请不要担心，我们后面会有更加优雅的解决方案。
sys_yield 的标准接口

思考我们之前提到的两种syscall.
在内核层实现的:
//os/syscall/mod

const SYSCALL_WRITE: usize = 64;
const SYSCALL_EXIT: usize = 93;

mod fs;
mod process;

use fs::*;
use process::*;

/// handle syscall exception with `syscall_id` and other arguments
pub fn syscall(syscall_id: usize, args: ) -> isize {
match syscall_id {
   SYSCALL_WRITE => sys_write(args, args as *const u8, args),
   SYSCALL_EXIT => sys_exit(args as i32),
   _ => panic!("Unsupported syscall_id: {}", syscall_id),
}
}在用户层实现的:
//user/syscall

use core::arch::asm;

const SYSCALL_WRITE: usize = 64;
const SYSCALL_EXIT: usize = 93;

fn syscall(id: usize, args: ) -> isize {
let mut ret: isize;
unsafe {
   asm!(
         "ecall",
         inlateout("x10") args => ret,
         in("x11") args,
         in("x12") args,
         in("x17") id
   );
}
ret
}

pub fn sys_write(fd: usize, buffer: &) -> isize {
syscall(SYSCALL_WRITE, )
}

pub fn sys_exit(exit_code: i32) -> isize {
syscall(SYSCALL_EXIT, )
}这里如果能理解到这里的同名的syscall,sys_write,sys_exit不是同一个函数,说明才理解到位 .
现在要继续实现一个系统调用 sys_yield.
于是要在用户层实现接口:
// user/src/syscall.rs

pub fn sys_yield() -> isize {
syscall(SYSCALL_YIELD, )
}

// user/src/lib.rs

pub fn yield_() -> isize { sys_yield() }SYSCALL_YIELD同样是一个需要定义的常量.
这里有个小问题,由于yield是rust的关键字 ,因此定义函数名字的时候增加了一个_ .
于是在内核层的syscall里边也需要增加一个判别,现在我只写成伪代码,因为具体我也不知道参数怎么填写:
pub fn syscall(syscall_id: usize, args: ) -> isize {
match syscall_id {
// 这里是伪代码
   SYSCALL_YIELD => sys_yield(...)
   // 这里是伪代码
   SYSCALL_WRITE => sys_write(args, args as *const u8, args),
   SYSCALL_EXIT => sys_exit(args as i32),
   _ => panic!("Unsupported syscall_id: {}", syscall_id),
}
}任务控制块与任务运行状态

思考上一章实现的AppManager,它包含了三部分:

[*]应用的数量 .
[*]当前运行应用.
[*]应用的入口地址 .
但是考虑当前的任务的状态,可能不是简单地如上图两任务的情况一样,而是存在更多的任务和更复杂的情景.
想到我们本节开头时候所说,要建立一个任务运行状态的概念,把任务归类为如下几种状态:

[*]未初始化
[*]准备执行
[*]正在执行
[*]已退出
因此可以使用rust构建这样一个结构体:
// os/src/task/task.rs

#
pub enum TaskStatus {
UnInit, // 未初始化
Ready, // 准备运行
Running, // 正在运行
Exited, // 已退出
}#这个注解有点类似于 Kotlin ,可以让编译器自动帮你实现一些方法:

[*]实现了 Clone Trait 之后就可以调用 clone 函数完成拷贝；
[*]实现了 PartialEq Trait 之后就可以使用 == 运算符比较该类型的两个实例，从逻辑上说只有两个相等的应用执行状态才会被判为相等，而事实上也确实如此。
[*]Copy 是一个标记 Trait，决定该类型在按值传参/赋值的时候采用移动语义还是复制语义。
回想起上一节提到的TaskContext,我们的任务控制块中需要保存的两部分也就知道了:

[*]TaskContext保存任务上下文
[*]TaskStatus保存任务状态
因此用rust构建这样一个结构体:
// os/src/task/task.rs

#
pub struct TaskControlBlock {
pub task_status: TaskStatus,
pub task_cx: TaskContext,
}任务管理器

那么有了TaskControlBlock,就可以实现一个任务管理器.
任务管理器需要管理多个任务,于是就需要知道:

[*]app 总数
[*]当前的任务
[*]每个任务的控制块
[*]任务状态
[*]任务上下文

这里使用了常量和变量分离的方法来实现它.
// os/src/task/mod.rs

pub struct TaskManager {
num_app: usize,
inner: UPSafeCell<TaskManagerInner>,
}

struct TaskManagerInner {
tasks: ,
current_task: usize,
}这是因为num_app是常量不需要变化,而inner是变量,需要用UPSafeCell,保证其内部可变性和单核时安全的借用能力.
这里在官方文档里提到了:

[*]在第二章的AppManager是可以通过current_app推测到上/下任务的.
[*]但是在TaskManger里的TaskManagerInner的current_task是只能感知当前任务.
为TaskManager创建全局实例TASK_MANAGER,仍然使用懒初始化的方法:
// os/src/task/mod.rs

lazy_static! {
pub static ref TASK_MANAGER: TaskManager = {
   let num_app = get_num_app();
   let mut tasks = [
         TaskControlBlock {
            task_cx: TaskContext::zero_init(),
            task_status: TaskStatus::UnInit
         };
         MAX_APP_NUM
   ];
   for i in 0..num_app {
         tasks.task_cx = TaskContext::goto_restore(init_app_cx(i));
         tasks.task_status = TaskStatus::Ready;
   }
   TaskManager {
         num_app,
         inner: unsafe { UPSafeCell::new(TaskManagerInner {
            tasks,
            current_task: 0,
         })},
   }
};
}这个初始化顺序是:

[*]使用上一节实现的 get_num_app来获取任务数量
[*]创建一个TaskControlBlock的数组 ,大小为设定好的 MAX_APP_NUM.
[*]然后通过上一节实现的 init_app_cx 来获取每个已经加载到内存的任务上下文.
[*]把所有的任务都初始化为 Ready 状态.
[*]然后用匿名函数的方式得到的 task 和初始化为0的current_task创建一个匿名 TaskManagerInner,随后包裹在 UPSafeCell 之中,和num_app一起创建一个TaskManager,传给TASK_MANAGER.
实现 sys_yield 和 sys_exit 系统调用

类似于上一章实现的内核层的syscall函数中会根据函数代码调用函数.
我们需要理解到的一点就是:

[*]应用层的 syscall 函数只是使用 ecall 触发Trap.
[*]内核层的 syscall函数才是真的具体实现.
我们现在讲的是内核层具体实现调用的函数,其作用是在syscall中作为一个分支 :
// os/src/syscall/process.rs

use crate::task::suspend_current_and_run_next;

pub fn sys_yield() -> isize {
suspend_current_and_run_next();
0
}这个是sys_yield,用于暂停当前的应用并切换到下个应用.
看它的具体实现实际上是抽象化了suspend_current_and_run_next接口,使得接口名称一致 .
这时候要考虑我们上一章实现的sys_exit:
//! App management syscalls
use crate::loader::run_next_app;
use crate::println;

/// task exits and submit an exit code
pub fn sys_exit(exit_code: i32) -> ! {
println!(" Application exited with code {}", exit_code);
run_next_app()
}打印了LOG之后,使用run_next_app切换到下一个APP.
那么考虑到现在run_next_app已经不适合于当前的有任务调度的系统,所以也要对sys_exit的具体实现进行修改.
// os/src/syscall/process.rs

use crate::task::exit_current_and_run_next;

pub fn sys_exit(exit_code: i32) -> ! {
println!(" Application exited with code {}", exit_code);
exit_current_and_run_next();
panic!("Unreachable in sys_exit!");
}可以看到现在的具体实现是抽象化了exit_current_and_run_next接口,使得接口名称一致 .
接下来我们只需要具体实现 ,刚刚提到的两个接口就行了:
// os/src/task/mod.rs

pub fn suspend_current_and_run_next() {
mark_current_suspended();
run_next_task();
}

pub fn exit_current_and_run_next() {
mark_current_exited();
run_next_task();
}这里摘抄出具体实现,但是具体实现中还是有三个函数有待实现 :

[*]mark_current_suspended
[*]mark_current_exited
[*]run_next_task
他们的具体实现要和上一章和上一节的实现对比:

[*]上一章: 加载应用然后修改程序指针直接开始运行 .
[*]上一节:直接修改程序指针直接开始运行.
这一章的实现是不同的,是通过修改用户的状态 ,解决.
// os/src/task/mod.rs

fn mark_current_suspended() {
TASK_MANAGER.mark_current_suspended();
}

fn mark_current_exited() {
TASK_MANAGER.mark_current_exited();
}

impl TaskManager {
fn mark_current_suspended(&self) {
   let mut inner = self.inner.borrow_mut();
   let current = inner.current_task;
   inner.tasks.task_status = TaskStatus::Ready;
}

fn mark_current_exited(&self) {
   let mut inner = self.inner.borrow_mut();
   let current = inner.current_task;
   inner.tasks.task_status = TaskStatus::Exited;
}
}然后再通过run_next_task来(根据状态) 决定(可以叫调度吗?对的...不对...对的对的...不对) 下一步要运行哪个Task.
// os/src/task/mod.rs

fn run_next_task() {
TASK_MANAGER.run_next_task();
}

impl TaskManager {
fn run_next_task(&self) {
   if let Some(next) = self.find_next_task() {
         let mut inner = self.inner.exclusive_access();
         let current = inner.current_task;
         inner.tasks.task_status = TaskStatus::Running;
         inner.current_task = next;
         let current_task_cx_ptr = &mut inner.tasks.task_cx as *mut TaskContext;
         let next_task_cx_ptr = &inner.tasks.task_cx as *const TaskContext;
         drop(inner);
         // before this, we should drop local variables that must be dropped manually
         unsafe {
            __switch(
               current_task_cx_ptr,
               next_task_cx_ptr,
            );
         }
         // go back to user mode
   } else {
         panic!("All applications completed!");
   }
}
}这里也是分为两部分:

[*]run_next_task是对TASK_MANAGER.run_next_task();的封装.
[*]对TaskManager结构体的run_next_task方法的实现.
[*]首先就是if let这种模式匹配写法,最开始没有掌握rust的开发技术,因此不懂.
[*]这时候查阅Rust圣经.关于if let的部分.
[*]当只需要进行一次匹配的时候就可以使用这个方法.
[*]使用匹配是为了解决用简单的 ==不能解决复杂类型匹配的情况.
[*]使用if let而不是match是为了解决只有None和非None两种情况的简单写法.

[*]查阅Rust圣经.关于Some的部分.
[*]Option枚举有两种可能
[*]Some代表有值,Some包裹的内容就是它的值
[*]一个在定义枚举类型的时候是 Some(T),T代表的是类型.Some(i32)就代表可以存储i32类型的值.
[*]在实例的时候Some(T)可以被实例化Some(3),就代表这个值存在且值为3.

[*]None代表没值

[*]因此这一段的结果意思是:
[*]如果self.find_next_task()的结果不是None,那么对应的返回值应该是Some(next).
[*]下面的逻辑里的next就是返回的Some()里包裹的next.代表下一个任务的任务号 .

[*]随后获取TaskManager.inner的单线程可变借用.
[*]从上一步的结果中获取当前任务.
[*]将下一个任务的状态改为运行中 .
[*]把当前任务号改为刚刚获取到的下一个任务号 .
[*]分别获取当前和下一个任务上下文.
[*]主动释放获取到的TaskManager.inner.
[*]因为如果不去主动释放要等函数运行结束才能继续访问这个TaskManager.inner里的内容.
[*]__switch需要操作TaskManager.inner里的task.task_cx的内容.

[*]使用上一节实现的 __switch 完成任务栈切换,如果已经忘了可以回去看看.

可以看到find_next_task是一个重要的方法,它的实现是这样的:
// os/src/task/mod.rs

impl TaskManager {
fn find_next_task(&self) -> Option<usize> {
   let inner = self.inner.exclusive_access();
   let current = inner.current_task;
   (current + 1..current + self.num_app + 1)
         .map(|id| id % self.num_app)
         .find(|id| {
            inner.tasks[*id].task_status == TaskStatus::Ready
         })
}
}它在获取TaskManager.inner的单线程可变借用之后对current_task为开头( 不包含它本身 )把整个数组看成一个环形队列然后逐个去查询状态 , 直到找到第一个状态为准备的任务.
这里关于Rust语言,每次我们遇到不会了的,不是光把它搞懂,还要把它上一层的偏概念性的东西搞懂.
这里用到的就是闭包和迭代器的知识:

[*]迭代器跟 for 循环颇为相似，都是去遍历一个集合，但是实际上它们存在不小的差别，其中最主要的差别就是：是否通过索引来访问集合。
[*]Iterator Trait 的 map 方法: Rust中的迭代器（Iterator）有一个map方法，它接收一个闭包（closure），并将迭代器中的每个元素传递给这个闭包。map方法会生成一个新的迭代器，其中的元素是闭包返回的结果。
[*]迭代器有一个find方法，它接收一个闭包作为参数。该闭包定义了要查找的条件，当迭代器中的元素满足这个条件时，find方法就会返回一个Option类型的结果，其中包含找到的第一个匹配项或者None如果没有任何元素满足条件。

[*]闭包一种匿名函数，它可以赋值给变量也可以作为参数传递给其它函数，不同于函数的是，它允许捕获调用者作用域中的值.
[*]有点像是某种C里的函数宏 ,用 do...while封装起来的这种.因此可以偷取别的作用域的变量来用.

这张图太好了:

第一次进入用户态

回想上一章,我们使用run_next_app调用了__restore调用sret回到用户态.
目前我们要第一次进入用户态应该也需要sret才可以.
但是思考一下上一章我们学到的__switch的实现,显然它是不改变特权级的.
因此第一次进入用户态还是要依赖__restore.
为了使用__restore则需要构建Trap上下文,把上一节实现的init_app_cx,移动到loader.rs:
// os/src/loader.rs

pub fn init_app_cx(app_id: usize) -> usize {
KERNEL_STACK.push_context(
   TrapContext::app_init_context(get_base_i(app_id), USER_STACK.get_sp()),
)
}再给TaskContext构造一个构建第一次执行任务的上下文的方法:
// os/src/task/context.rs

impl TaskContext {
pub fn goto_restore(kstack_ptr: usize) -> Self {
   extern "C" { fn __restore(); }
   Self {
         ra: __restore as usize,
         sp: kstack_ptr,
         s: ,
   }
}
}在这个操作之中,

[*]传入了一个内核栈指针 .
[*]使用如下内容构建一个 TaskContext.
[*]内核栈指针作为任务上下文的栈指针 .
[*]__restore的函数地址作为函数调用完毕返回地址 .也就是说 __switch的ret执行完毕之后执行__restore.
[*]空的s0~s12.

需要注意的是， __restore 的实现需要做出变化：它不再需要在开头 mv sp, a0 了。因为在 __switch 之后，sp 就已经正确指向了我们需要的 Trap 上下文地址。
然后在创建 TaskManager 的全局实例 TASK_MANAGER 的时候为每个任务上下文 , 初始化为由如下内容组成的TaskContext:

[*]链接进去的任务内存位置决定的每个任务的内核栈指针作为栈指针.
[*]__restore作为函数调用完毕返回地址 .
[*]空的s0~s12.
为TaskContext构建一个执行第一个任务的方法:
impl TaskManager {
fn run_first_task(&self) -> ! {
   let mut inner = self.inner.exclusive_access();
   let task0 = &mut inner.tasks;
   task0.task_status = TaskStatus::Running;
   let next_task_cx_ptr = &task0.task_cx as *const TaskContext;
   drop(inner);
   let mut _unused = TaskContext::zero_init();
   // before this, we should drop local variables that must be dropped manually
   unsafe {
         __switch(
            &mut _unused as *mut TaskContext,
            next_task_cx_ptr,
         );
   }
   panic!("unreachable in run_first_task!");
}这段代码可以这样理解:

[*]获取单线程的借用 .
[*]获取第一个任务块的指针 .
[*]随后把这个任务设置为运行状态 .
[*]获取这个任务的上下文 .
[*]由于后续要使用__switch因此需要主动释放这个借用.
[*]使用__switch调用
[*]由zero_init构建的一个全空的上下文.
[*]第一个任务的上下文.

这时候这个执行顺序有点乱了,我尝试画一个流程图.
首先是这章实现的结构体TaskManager的结构:

初始化的流程为:

初始化后的TASK_MANAGER:

调用run_fist_app之后发生了什么:

这时候考虑APP发生挂起的时候会发生什么:

尝试构建本章实验

首先先看用户层的APP,回想对于用户层有影响的改动:

[*]实现yield接口以挂起应用程序.
[*]这里注意修改exit的实现并不影响用户层.
其实从写代码的用户来看对用户层没有任何影响的.
但是如果我们不调用yield我们怎么体现我们这章的内容呢?那不是还是顺序执行 ?
"诶呦,这不是显得您枪法准吗?"------不执行yeild的应用程序

"不对啊,我是主角啊!"------协作式调度

创建APP

于是我们需要重新设计几个APP,而且可以在执行耗时操作之后主动使用yield释放CPU.
这里官方代码设计了00write_a.rs,01write_b.rs,02write_c.rs,三个APP.
分别用于打印HEIGHT行有WIDTH个的A,B和C.并且都调用了yield,用于挂起应用,这样和顺序执行相比就会有区别.
这里我们把原来的user/src/bin下的APP全部都移到user/src/temp下,然后在user/src/bin里创建如上三个文件.
实现用户层yield

和上一章一样,只要明白用户层的调用是套壳的就很容易写出来:

[*]约定调用号
[*]调用syscall
[*]封装成函数
在user/src/syscall.rs里完成前两步 :
const SYSCALL_YIELD: usize = 124;

pub fn sys_yield() -> isize {
syscall(SYSCALL_YIELD, )
}这个传入的参数其实也很暧昧 , 因为实际上这里这么写相当于默认了不需要传输其他参数到内核层.
.
这里理解为只是一步挂起操作不需要更多信息 .
在user/src/lib.rs里完成第三步:
pub fn yield_() -> isize {
sys_yield()
}编译APP

这时候进行编译,以得到.bin文件:
cd user
make clean
make build实现内核层的操作

syscall模块

对应用户层,真正执行用户层的指令的是内核层:

[*]对应约定好的调用号调用函数
[*]实现需要调用的函数
[*]修改sys_exit
[*]实现sys_yield

在os/src/syscall/mod.rs里完成第一步 :
const SYSCALL_YIELD: usize = 124;

pub fn syscall(syscall_id: usize, args: ) -> isize {
match syscall_id {
   SYSCALL_WRITE => sys_write(args, args as *const u8, args),
   SYSCALL_EXIT => sys_exit(args as i32),
   SYSCALL_YIELD => sys_yield(),
   _ => panic!("Unsupported syscall_id: {}", syscall_id),
}
}在os/src/syscall/process.rs里完成第二步:
use crate::task::{exit_current_and_run_next, suspend_current_and_run_next};

/// task exits and submit an exit code
pub fn sys_exit(exit_code: i32) -> ! {
println!(" Application exited with code {}", exit_code);
exit_current_and_run_next();
panic!("Unreachable in sys_exit!");
}

/// current task gives up resources for other tasks
pub fn sys_yield() -> isize {
suspend_current_and_run_next();
0
}这里调用的exit_current_and_run_next和suspend_current_and_run_next都需要在task模块里是实现.
task模块

回忆有关于task的冗杂的数据结构,我们全部都要在这个模块里实现.

[*]首先需要创建os/src/task文件夹
[*]在文件夹中创建context.rs用来实现数据结构TaskContext.
[*]储存如图上所示的上下文
[*]因为TaskContext在第一次初始化的时候需要, __swtich调用一个空的TaskContext和第一个任务的TaskContext进行切换
[*]实现一个生成空结构的方法
[*]实现一个每个任务的初始化方法

[*]在文件夹中创建task.rs实现枚举类型 TaskControlBlock用来保存单个任务信息.
[*]实现TaskStatus枚举任务状态
[*]用TaskContext保存任务上下文.

[*]封装__switch,实现上下文切换.
[*]在文件夹中创建mod.rs用来实现数据结构TaskManager
[*]储存num_app
[*]实现数据结构TaskManagerInner
[*]储存当前任务current_task
[*]实现数据结构TaskControlBlock,储存TaskControlBlock的数组tasks

[*]用UPSafeCell包裹TaskManagerInner
[*]它需要有几个功能,要实现成对应的方法:
[*]挂起/关闭任务
[*]挂起并执行下一个任务
[*]标记挂起
[*]寻找下一个任务
[*]执行下一个任务

[*]关闭并执行下一个任务
[*]标记关闭
[*]寻找下一个任务
[*]执行下一个任务

[*]执行第一个任务

[*]在mod.rs中懒初始化一个全局的TaskManager
context.rs

如上所述:
//! Implementation of [`TaskContext`]

/// Task Context
#
#
pub struct TaskContext {
/// return address ( e.g. __restore ) of __switch ASM function
ra: usize,
/// kernel stack pointer of app
sp: usize,
/// callee saved registers:s 0..11
s: ,
}

impl TaskContext {
/// init task context
pub fn zero_init() -> Self {
   Self {
         ra: 0,
         sp: 0,
         s: ,
   }
}

/// set task context {__restore ASM funciton, kernel stack, s_0..12 }
pub fn goto_restore(kstack_ptr: usize) -> Self {
   extern "C" {
         fn __restore();
   }
   Self {
         ra: __restore as usize,
         sp: kstack_ptr,
         s: ,
   }
}
}这里需要注意的就是有类似于JAVA里的直接对象传递,深浅拷贝,C++的拷贝构造相关的东西.
这周复杂的结构体一定要使用#为它实现拷贝方法.# 是 Rust 语言中的一个属性宏，用于自动为结构体（struct）或枚举（enum）实现 Copy 和 Clone trait。

[*]Copy trait 表示类型的数据可以被复制，而不需要所有权转移。当一个值类型实现了 Copy，意味着你可以无需任何额外成本地将该值复制给另一个变量。这通常适用于简单的数据类型，如整数、浮点数等，因为它们的复制成本较低。
[*]Clone trait 则提供了一个 .clone() 方法，用于创建类型的一个副本。与 Copy 不同，Clone 可以用于更复杂的数据类型，包括那些包含指针或者需要较深拷贝的数据结构。使用 .clone() 方法会调用分配器，因此可能有额外的性能开销。
task.rs

如上所述:
//! Types related to task management

use super::TaskContext;

#
pub struct TaskControlBlock {
pub task_status: TaskStatus,
pub task_cx: TaskContext,
}

#
pub enum TaskStatus {
UnInit,
Ready,
Running,
Exited,
}switch.rs

如上所述,需要封装一个switch函数来保证在调用__switch时的自动上下文保存.
因此需要创建os/src/task/switch.rs和os/src/task/switch.S用以实现.
switch.rs内容,明确指定了传入的两个参数的指针类型:
use super::TaskContext;
use core::arch::global_asm;

global_asm!(include_str!("switch.S"));

extern "C" {
pub fn __switch(current_task_cx_ptr: *mut TaskContext, next_task_cx_ptr: *const TaskContext);
}switch.S内容,就是上一节讲的__switch函数:
.altmacro
.macro SAVE_SN n
sd s\n, (\n+2)*8(a0)
.endm
.macro LOAD_SN n
ld s\n, (\n+2)*8(a1)
.endm
.section .text
.globl __switch
__switch:
# __switch(
# current_task_cx_ptr: *mut TaskContext,
# next_task_cx_ptr: *const TaskContext
# )
# save kernel stack of current task
sd sp, 8(a0)
# save ra & s0~s11 of current execution
sd ra, 0(a0)
.set n, 0
.rept 12
   SAVE_SN %n
   .set n, n + 1
.endr
# restore ra & s0~s11 of next execution
ld ra, 0(a1)
.set n, 0
.rept 12
   LOAD_SN %n
   .set n, n + 1
.endr
# restore kernel stack of next task
ld sp, 8(a1)
ret因为每次调用__restore的时候已经由__switch把sp指向TrapContext了,因此需要去掉:
mv sp, a0在把它引用为一个函数时也要变化:
// 之前
extern "C" {
fn __restore(cx_addr: usize);
}
// 现在
extern "C" {
fn __restore();
}mod.rs

如上所述,实现这两个结构体:
pub struct TaskManager {
num_app: usize,
inner: UPSafeCell<TaskManagerInner>,
}

struct TaskManagerInner {
current_task: usize,
tasks: ,
}实现的方法:
impl TaskManager
{
fn run_first_task(&self) ->!
{
   let mut inner = self.inner.exclusive_access();
   let task0 = &mut inner.tasks;
   task0.task_status = TaskStatus::Running;
   let next_task_cx_ptr = &task0.task_cx as *const TaskContext;
   let mut _unused = TaskContext::zero_init();
   drop(inner);
   unsafe
   {
         __switch(&mut _unused as *mut TaskContext, next_task_cx_ptr)
   }
   panic!("unreachable in run_first_task");
}

fn mark_current_suspended(&self)
{
   let mut inner = self.inner.exclusive_access();
   let current = inner.current_task;
   inner.tasks.task_status = TaskStatus::Ready;
}

fn mark_current_exited(&self)
{
   let mut inner = self.inner.exclusive_access();
   let current = inner.current_task;
   inner.tasks.task_status = TaskStatus::Exited;
}

fn find_next_task(&self) -> Option<usize>
{
   let inner = self.inner.exclusive_access();
   let current = inner.current_task;
   (current + 1..current+1+self.num_app)
         .map(|id| id%self.num_app)
         .find(|id| inner.tasks[*id].task_status == TaskStatus::Ready)
}

fn run_next_task(&self)
{
   if let Some(next) = self.find_next_task()
   {
         let mut inner = self.inner.exclusive_access();
         let current = inner.current_task;
         inner.current_task = next;
         inner.tasks.task_status = TaskStatus::Running;
         let current_task_cx_ptr = &mut inner.tasks.task_cx as *mut TaskContext;
         let next_task_cx_ptr = &mut inner.tasks.task_cx as *const TaskContext;
         drop(inner);
         unsafe
         {
            __switch(current_task_cx_ptr, next_task_cx_ptr)
         }
   }
   else
   {
         println!("All applications completed!");
         shutdown(false);
   }
}
}

lazy_static!
{
/// 全局单例的任务管理器
pub static ref TASK_MANAGER: TaskManager =
{
   let num_app = get_num_app();
   let mut tasks = [TaskControlBlock{
         task_status: TaskStatus::UnInit,
         task_cx: TaskContext::zero_init(),
   }
   ; MAX_APP_NUM];
   for(i,task) in tasks.iter_mut().enumerate()
   {
         task.task_cx = TaskContext::goto_restore(init_app_cx(i));
         task.task_status = TaskStatus::Ready;
   }
   TaskManager
   {
         num_app,
         inner: unsafe
         {
            UPSafeCell::new(TaskManagerInner
            {
               tasks,
               current_task: 0,
            })
         }
   }
};
}这里注意使用__switch之前一定要主动drop(inner).
懒初始化的单例对象:
lazy_static!
{
pub static ref TASK_MANAGER: TaskManager =
{
   let num_app = get_num_app();
   let mut tasks = [TaskControlBlock{
         task_status: TaskStatus::UnInit,
         task_cx: TaskContext::zero_init(),
   }
   ; MAX_APP_NUM];
   for(i,task) in tasks.iter_mut().enumerate()
   {
         task.task_cx = TaskContext::goto_restore(init_app_cx(i));
         task.task_status = TaskStatus::Ready;
   }
   TaskManager
   {
         num_app,
         inner: unsafe
         {
            UPSafeCell::new(TaskManagerInner
            {
               tasks,
               current_task: 0,
            })
         }
   }
};
}对这个单例对象的操作的封装:
pub fn run_first_task() {
TASK_MANAGER.run_first_task();
}

fn mark_current_suspended()
{
TASK_MANAGER.mark_current_suspended();
}

fn mark_current_exited()
{
TASK_MANAGER.mark_current_exited();
}

fn run_next_task()
{
TASK_MANAGER.run_next_task();
}

pub fn suspend_current_and_run_next()
{
mark_current_suspended();
run_next_task();
}

pub fn exit_current_and_run_next()
{
mark_current_exited();
run_next_task();
}修改Trap调用

因为现在已经没有run_next_app了只有新实现的suspend_current_and_run_next和exit_current_and_run_next.
因此把出现非法调用的切换APP的API修改为exit_current_and_run_next..
// use crate::loader::run_next_app;

#
/// handle an interrupt, exception, or system call from user space
pub fn trap_handler(cx: &mut TrapContext) -> &mut TrapContext {
let scause = scause::read(); // get trap cause
let stval = stval::read(); // get extra value
match scause.cause() {
   Trap::Exception(Exception::UserEnvCall) => {
         cx.sepc += 4;
         cx.x = syscall(cx.x, , cx.x, cx.x]) as usize;
   }
   Trap::Exception(Exception::StoreFault) | Trap::Exception(Exception::StorePageFault) => {
         println!(" PageFault in application, kernel killed it.");
         exit_current_and_run_next();
   }
   Trap::Exception(Exception::IllegalInstruction) => {
         println!(" IllegalInstruction in application, kernel killed it.");
         exit_current_and_run_next();
   }
   _ => {
         panic!(
            "Unsupported trap {:?}, stval = {:#x}!",
            scause.cause(),
            stval
         );
   }
}
cx
}这里在查看参考代码的时候看到一个很好的操作,虽然参考代码是出现权限错误就直接报panic.
#
/// handle an interrupt, exception, or system call from user space
pub fn trap_handler(cx: &mut TrapContext) -> &mut TrapContext {
let scause = scause::read(); // get trap cause
let stval = stval::read(); // get extra value
match scause.cause() {
   Trap::Exception(Exception::UserEnvCall) => {
         cx.sepc += 4;
         cx.x = syscall(cx.x, , cx.x, cx.x]) as usize;
   }
   Trap::Exception(Exception::StoreFault) | Trap::Exception(Exception::StorePageFault) => {
         println!(" PageFault in application, bad addr = {:#x}, bad instruction = {:#x}, kernel killed it.", stval, cx.sepc);
         panic!(" Cannot continue!");
         //run_next_app();
   }
   Trap::Exception(Exception::IllegalInstruction) => {
         println!(" IllegalInstruction in application, kernel killed it.");
         panic!(" Cannot continue!");
         //run_next_app();
   }
   _ => {
         panic!(
            "Unsupported trap {:?}, stval = {:#x}!",
            scause.cause(),
            stval
         );
   }
}
cx
}这里的:
println!(" PageFault in application, bad addr = {:#x}, bad instruction = {:#x}, kernel killed it.", stval, cx.sepc);sepc保存的是发生异常的指令 .
stval保存的是了陷入（trap）的附加信息:

[*]地址例外中出错的地址
[*]发生非法指令例外的指令本身
[*]对于其他异常，它的值为 0
有了这两个寄存器的硬件帮助,我们实现一些东西也变得简单了起来,这里可以用于完成第二章作业第五题.
修改main函数

把run_next_app改成run_first_task即可:
/// the rust entry-point of os
#
pub fn rust_main() -> ! {
extern "C" {
   fn stext(); // begin addr of text segment
   fn etext(); // end addr of text segment
   fn srodata(); // start addr of Read-Only data segment
   fn erodata(); // end addr of Read-Only data ssegment
   fn sdata(); // start addr of data segment
   fn edata(); // end addr of data segment
   fn sbss(); // start addr of BSS segment
   fn ebss(); // end addr of BSS segment
   fn boot_stack_lower_bound(); // stack lower bound
   fn boot_stack_top(); // stack top
}
clear_bss();
logging::init();
println!(" Hello, world!");
trace!(
   " .text [{:#x}, {:#x})",
   stext as usize,
   etext as usize
);
debug!(
   " .rodata [{:#x}, {:#x})",
   srodata as usize, erodata as usize
);
info!(
   " .data [{:#x}, {:#x})",
   sdata as usize, edata as usize
);
warn!(
   " boot_stack top=bottom={:#x}, lower_bound={:#x}",
   boot_stack_top as usize, boot_stack_lower_bound as usize
);
error!(" .bss [{:#x}, {:#x})", sbss as usize, ebss as usize);
trap::init();
println!(" trap init end");
loader::load_apps();
task::run_first_task();
panic!("Unreachable in rust_main!");
}编译运行

make run运行结果:
RustSBI version 0.3.1, adapting to RISC-V SBI v1.0.0
.______    __ __    _______.___________._______..______ __
| _\ |||| /    |       | /    || _\ ||
||_)| |||| | (----`---||----`| (----`||_)|||
|    / |||| \ \    ||    \ \ | _< ||
||\\----.|`--'|.----) |    ||.----) | ||_)|||
| _| `._____| \______/ |_______/    |__||_______/ |______/ |__|
Implementation : RustSBI-QEMU Version 0.2.0-alpha.2
Platform Name    : riscv-virtio,qemu
Platform SMP    : 1
Platform Memory : 0x80000000..0x88000000
Boot HART       : 0
Device Tree Region : 0x87000000..0x87000f02
Firmware Address : 0x80000000
Supervisor Address : 0x80200000
pmp01: 0x00000000..0x80000000 (-wr)
pmp02: 0x80000000..0x80200000 (---)
pmp03: 0x80200000..0x88000000 (xwr)
pmp04: 0x88000000..0x00000000 (-wr)
Hello, world!
trap init end
AAAAAAAAAA
BBBBBBBBBB
CCCCCCCCCC
AAAAAAAAAA
BBBBBBBBBB
CCCCCCCCCC
AAAAAAAAAA
Test write_b OK!
Application exited with code 0
CCCCCCCCCC
AAAAAAAAAA
Test write_c OK!
Application exited with code 0
AAAAAAAAAA
Test write_a OK!
Application exited with code 0
All applications completed!
来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

馏栩梓 发表于 2025-10-12 02:04:47

感谢，下载保存了

赵淳美 发表于 2025-10-21 08:02:27

谢谢分享，辛苦了

邰怀卉 发表于 2025-11-11 15:36:20

懂技术并乐意极积无私分享的人越来越少。珍惜

蔓好发表于 2025-11-20 11:31:48

谢谢分享，辛苦了

劳怡月 发表于 2025-11-29 13:47:42

新版吗？好像是停更了吧。

施婉秀 发表于 3 天前

鼓励转贴优秀软件安全工具和文档！

页: [1]

程序园's Archiver

[rCore学习笔记 024]多道程序与协作式调度