OS-lab6
OS-lab6
管道
在lab5的时候我们实现了文件类设备的读写操作,而在fd.c中,我们定义了3种设备:文件类设备、管道、终端,其中终端已经被完成了,剩下的就是管道了。
管道是一种父子进程间通信的设备,这样的通信是单向的。建立一个匿名管道的流程首先是建立一个缓冲文件,接着
user/pipe.c
首先我们来看看控制管道的结构体
Pipe
。这个结构体很简单,由读取端位置、写入端位置、缓冲区组成,在这个实验中采用的是环形缓冲区。接着我们来创建一个管道。
pipe
函数用于创建一个管道。在 pipe 中,首先分配两个文件描述符 fd0,fd1 并为其分配空间,然后给 fd0 对应的虚拟地址分配一页物理内存,再将 fd1 对应的虚拟地址映射到相同的物理内存。这一页上存的就是Pipe结构体,从而使得这两个文件描述符能够共享一个管道的数据缓冲区。
这个时候创建的管道结构是这样的
之后则需要根据具体情况关闭读端或写端,形成第一张图那样的单向流通的结构。
接下来我们开始完成管道的读写。
完成读写的功能思路很简单,也就是基本的生产者消费者模型。所以如果管道数据为空,即当
p_rpos >= p_wpos
时,应该进程切换到写者运行;写者必须得在p_wpos - p_rpos < BY2PIPE
时方可运行,也就是通过读写端的相对位置进行切换。
piperead
函数先通过fd2data
取得Pipe
结构体,判断缓冲区是否为空,若为空则判断管道是否关闭,如果没关闭就进行调度;接着循环读取缓冲区,遇到缓冲区为空则需要判断管道是否关闭和进行调度,直到读取n字节。
pipewrite
函数与piperead
函数类似,不过这个函数每次必须写满缓冲区或写满n字节才会进行调度或退出。主体功能完成了,还有一些细节问题需要我们仔细思考,那就是读写结束应该如何判断,也就是判断管道另一端是否关闭。
假设这样的情景:管道写端已经全部关闭,读者读到缓冲区有效数据的末尾,此时有 p_rpos = p_wpos。按照上面的做法,我们这里应当切换到写者运行。但写者进程已经结束,进程切换就造成了死循环,这时候读者进程如何知道应当退出了呢?
在这里,我们利用页面的引用来完成这个功能。
第一张图上我们可以看到,管道文件所在的物理页被写端和读端同时引用,也就是说有这样的等式成立pageref(rfd) + pageref(wfd) = pageref(pipe)
。对于每一个匿名管道而言,我们分配了三页空间:一页是读数据的文件描述符 rfd,一页是写数据的文件描述符 wfd,剩下一页是被两个文件描述符共享的管道数据缓冲区。
而如果写端关闭,则
pageref(wfd)=0
,此时满足pageref(rfd)=pageref(pipe)
,因此可以使用这样的机制来判断某一端是否关闭。这个问题看上去确实解决了,不过还留有隐患。之前提到了进程需要关闭读端或写端才能进行通信,在这里调用了
close
函数。int close(int fdnum)
{
int r;
struct Dev *dev;
struct Fd *fd;
if ((r = fd_lookup(fdnum, &fd)) < 0
|| (r = dev_lookup(fd->fd_dev_id, &dev)) < 0) {
return r;
}
r = (*dev->dev_close)(fd);
fd_close(fd);
return r;
}
可以看到这个函数分为两步,首先是移除设备到
fd
的引用,然后是移除进程对fd
的引用。就有可能出现这种情况:pipe(p);
if(fork() == 0){//子进程
close(p[1]);
//中断1发生在close和read之间
read(p[0], buf, sizeof buf);
}else{//父进程
close(p[0]);//中断2发生在dev_close和fd_close之间
write(p[1], "zzz", 3);
}
这个时候,父子进程都对
p[0]
有引用,引用量为2,父进程对p[1]
有引用,引用量为1,而pipe
被父进程的p[1]
和子进程的p[0]
引用,引用量是2,这时子进程再执行read
,比较pipe
的引用和p[0]
的引用发现一样,认为p[1]
关闭,因此就退出了。不幸的是,fd.c中的
dup
也出了类似的问题。在dup
函数中发生了两次映射,首先是把oldfd
映射到newfd
中,然后再把oldfd
的内容映射过去。比如dup(p[0], 10)
这样的调用,会首先增加p[0]
的引用,然后再增加pipe
的引用,如果中断在这中间产生,那么pipe
的引用是没有增加的,这时就出现了之前一样的问题,pipe
的引用可能与p[0]
或p[1]
相等,造成误判。这两个函数最大的问题在于,建立映射和移除映射的顺序导致了
pipe
的引用不能保证一直最大。在知道了这个问题的根源后,进行修复的操作也很容易了,就是调整顺序,保证pipe
的引用最大即可。那现在就万无一失了吗?先别急,我们来看看判断管道关闭的函数
_pipeisclosed
。根据我们的等式,当
p[0]
或p[1]
的引用与pipe
相等时就判断为一端已经关闭,显然,我们需要先获得这两者的引用才行。pfd = pageref(fd);
pfp = pageref(pipe); if (pfd == pfp){
return 1;
}
return 0;
很显然,我们会想到这样写。
还是上面的例子,假如子进程执行完
close(p[1])
后没有中断1,而是继续执行read
,此时因为父进程未运行,缓冲区为空,就进入了_pipeisclosed
函数判断是否一端已经关闭,在获得了pfd
的引用量2后,中断1发生;父进程执行到wrtie
中途中断2发生,这个时候已经关闭了p[0]
;子进程执行,获得的pipe
的引用量为2,两者相等,发生误判。这个例子我们可以知道,我们获得的引用量也可能是错误的,原因在于我们没有得到最新的引用量,从而引起了误判。因此,我们需要一个循环来获得最新的引用,不过怎么知道循环可以退出呢?那就是得到的最新的引用,怎么知道这是最新的引用呢?那就是在执行过程中没有中断发生,怎么知道没有中断发生?在lab3中我们知道在时钟中断发生时,会进入调度函数
sched_yeild
进行调度,在调度的最后会进入env_run
切换运行,在这个函数中我们会增加env_runs
代表运行的次数。也就是说,这个变量能够指示中断的发生。因此,我们在取得引用之前,先记录一下当时的env_runs
,在取得引用之后再判断现在的env_runs
是否一样,如果不一样则证明发生了中断,需要再次获得引用,一样则证明没有中断发生,可以退出循环。到这里,我们终于完成管道退出的判断函数
_pipeisclosed
了。整个管道的读写我们就完成了。
shell
最后,我们还需要完成一个用户的交互界面,也就是shell。具体来说,我们需要能够读取用户输入的命令,并通过操作系统执行这些命令。那么命令在操作系统中是什么?在user文件夹下有ls.c、echo.c等几个文件,这几个文件就是命令的源码,最终会形成可执行文件,我们调用的命令,实际上就是运行这些可执行文件。而在此之前,我们还需要一个进程来解析这些命令,这就是sh.c。
user/sh.c
这就是shell进程。
_gettoken
函数用于获得标识。
runcmd
函数根据获得的标识运行指令。
readline
函数用于读取一行指令。注意到在
runcmd
中,在真正执行指令的时候实际是调用了spawn
函数完成,这个函数就是具体的加载并运行一个命令文件的函数。user/spawn.c
这个文件完成了加载命令文件并运行的功能。
init_stack
函数用于初始化栈。
usr_is_elf_format
函数用于判断文件是否为可执行文件。
usr_load_elf
函数用于将可执行文件载入到内存中。我们在lab3中完成了这个任务,即load_icode_mapper
函数,基本上就是照抄一遍。那为什么不能直接调用那个函数呢?首先,那个函数处于内核态,没有系统调用可以访问,此外,我们在lab3中最终是在init.c中利用ENV_CREATE
手动创建进程,而对于输入不确定的shell来说,这显然做不到。
spawn
函数用于载入命令文件。首先通过open
打开文件,得到文件描述符;接着判断这个文件是否是可执行文件;接着使用syscall_env_alloc
获得一个空闲的进程;通过init_stack
初始化栈,接着利用usr_load_elf
载入可执行文件,这里需要知道elf文件的格式,找到并载入所有的程序段;设置pc值和栈帧等;复制获得父进程的共享页表;最后设置进程状态。这个函数中出现的子进程也就是当前的shell进程的子进程,就是命令文件执行的进程。
到这里,我们就能够通过命令行与操作系统进行交互了。
OS大厦,完成!
OS-lab6的更多相关文章
- ucore操作系统学习(六) ucore lab6线程调度器
1. ucore lab6介绍 ucore在lab5中实现了较为完整的进程/线程机制,能够创建和管理位于内核态或用户态的多个线程,让不同的线程通过上下文切换并发的执行,最大化利用CPU硬件资源.uco ...
- [OS] 操作系统课程(三)
工具 源码阅读:understand 源码文档自动生成工具:Doxygen 编译环境:gcc 运行环境:x86机器或QEMU 调试工具:QEMU+(GDB or IDE) IDE:Eclipse-CD ...
- NodeJs之OS
OS Node.js提供了一些基本的底层操作系统的模块OS. API var os = require('os'); console.log('[arch] 操作系统CPU架构'+os.arch()) ...
- Node.js:OS模块
os模块,可以用来获取操作系统相关的信息和机器物理信息,例如操作系统平台,内核,cpu架构,内存,cpu,网卡等信息. 使用如下所示: const os = require('os'); var de ...
- Xamarin+Prism开发详解四:简单Mac OS 虚拟机安装方法与Visual Studio for Mac 初体验
Mac OS 虚拟机安装方法 最近把自己的电脑升级了一下SSD固态硬盘,总算是有容量安装Mac 虚拟机了!经过心碎的安装探索,尝试了国内外的各种安装方法,最后在youtube上找到了一个好方法. 简单 ...
- Mac OS 使用 Vagrant 管理虚拟机(VirtualBox)
Vagrant(官网.github)是一款构建虚拟开发环境的工具,支持 Window,Linux,Mac OS,Vagrant 中的 Boxes 概念类似于 Docker(实质是不同的),你可以把它看 ...
- Mac OS、Ubuntu 安装及使用 Consul
Consul 概念(摘录): Consul 是 HashiCorp 公司推出的开源工具,用于实现分布式系统的服务发现与配置.与其他分布式服务注册与发现的方案,比如 Airbnb 的 SmartStac ...
- java 利用ManagementFactory获取jvm,os的一些信息--转
原文地址:http://blog.csdn.net/dream_broken/article/details/49759043 想了解下某个Java项目的运行时jvm的情况,可以使用一些监控工具,比如 ...
- 让 ASP.NET vNext 在 Mac OS 中飞呀飞。。。
写在前面 阅读目录: 娓娓道来 Install ASP.NET vNext Command Line Tools 安装 Homebrew 使用 Homebrew,安装 KVM Install Subl ...
- Mac OS X 上编写 ASP.NET vNext (二) IDE配置
上一篇中介绍了如何在OS X上搭建.Net运行时.不过光有运行时还不够,还需要有一个好用的IDE,有了IDE的支持,OS X上的开发才称为可能. 和上篇类似,这里先列举出具体步骤,个人可以根据自己的情 ...
随机推荐
- 12月5日内容总结——JS基础知识及变量常量、基本数据类型、运算符、流程控制、函数、内置对象
目录 一.JS简介 简介 ECMAScript的历史 二.JS基础 1.注释语法 2.引入js的多种方式 3.结束符号 三.变量与常量 编写和运行js代码的两种方式 变量声明 四.基本数据类型 1.数 ...
- 进阶技术:Linux Arm32是如何调用C Main的
前言: Linux x64通过qemu的rdinit方式调用的C Main,实际上是通过load_elf_binary(加载和解析elf)和start_thread(设置Ip和sp),用缺页异常来调用 ...
- python自动发布-优化版本
import sys import time import os import paramiko from pygments.lexers import shell baseconfig = { &q ...
- Windows 10 企业版 LSTC 激活秘钥及方法
Windows 10 企业版 LSTC 秘钥:M7XTQ-FN8P6-TTKYV-9D4CC-J462D 同时按下Win键+X,然后选择Windows PowerShell(管理员)按顺序输入下面的字 ...
- 深度优先搜索算法-dfs讲解
迷宫问题 有一个迷宫: S**. .... ***T (其中字符S表示起点,字符T表示终点,字符*表示墙壁,字符.表示平地.你需要从S出发走到T,每次只能向上下左右相邻的位置移动,不能走出地图,也不能 ...
- RocketMQ - 生产者原理
https://rocketmq.apache.org/ Apache RocketMQ是一款开源的.分布式的消息投递与流数据平台.出生自阿里巴巴,在阿里巴巴内部经历了3个版本后,作为Apache 顶 ...
- JAVA8 常见用法
1 . 集合List<T> 去单个元素,返回集合 List<Tbhr01> tbhr01List = new ArrayList<Tbhr01>(); List&l ...
- LG P4449 & JZOJ 于神之怒
\(\text{Problem}\) JZOJ上,求 \[\sum_{i=1}^n \sum_{j=1}^m \gcd(i,j)^k \] 对 \(10^9+7\) 取模 \(n,m,k \le 5 ...
- vue element-ui table 实现自动滚动效果
<el-table :data="tableData" stripe class="swiper-page-table" ref="table& ...
- PostgreSQL大表count方法总结及优化探讨
PostgreSQL的MVCC是直接在原表通过增加新tuple来实现的,决定了它在大结果集count的时候性能不会太理想,因为需要对大结果集做可见性判断将会是一项繁重的工作,比如下面这种SQL: se ...