Linux是一个多任务的作业系统,系统上运行着多个进程,正在执行的一个或多个相关进程称为一个作业。
基本介绍
- 中文名Linux进程管理及作业控制
- 类别系统软体
- 套用系统Linux
- Linux定位多任务的作业系统
介绍
用作业控制,用户可以运行多个作业,并在需要时在作业之间进行切换。本章详细介绍进程管理及作业控制的命令,包括启动进程、查看进程、调度作业的命令。
进程及作业的概念
Linux是一个多用户多任务的作业系统。多用户是指多个用户可以在同一时间使用计算机系统;多任务是指Linux可以执行几个任务,它可以在还未执行完一个任务时又执行另一项任务。 作业系统管理多个用户的请求和多个任务。
大多数系统都只有一个CPU和一个主存,但一个系统可能有多个二级存储磁碟和多个输入/输出设备。作业系统管理这些资源并在多个用户间共享资源,当您提出一个请求时,给您造成一种假象,好像系统只被您独自占用。而实际上作业系统监控着一个等待执行的任务伫列,这些任务包括用户作业、作业系统任务、邮件和列印作业等。作业系统根据每个任务的优先权为每个任务分配合适的时间片,每个时间片大约都有零点几秒,虽然看起来很短,但实际上已经足够计算机完成成千上万的指令集。每个任务都会被系统运行一段时间,然后挂起,系统转而处理其他任务;过一段时间以后再回来处理这个任务,直到某个任务完成,从任务伫列中去除。
Linux系统上所有运行的东西都可以称之为一个进程。每个用户任务、每个系统管理守护进程,都可以称之为进程。Linux用分时管理方法使所有的任务共同分享系统资源。我们讨论进程的时候,不会去关心这些进程究竟是如何分配的,或者是核心如何管理分配时间片的,我们所关心的是如何去控制这些进程,让它们能够很好地为用户服务。
进程的一个比较正式的定义是在自身的虚拟地址空间运行的一个单独的程式。进程与程式是有区别的,进程不是程式,虽然它由程式产生。程式只是一个静态的指令集合,不占系统的运行资源;而进程是一个随时都可能发生变化的、动态的、使用系统运行资源的程式。而且一个程式可以启动多个进程。
Linux作业系统包括三种不同类型的进程,每种进程都有自己的特点和属性。
互动进程——由一个shell启动的进程。互动进程既可以在前台运行,也可以在后台运行。
批处理进程——这种进程和终端没有联繫,是一个进程式列。
监控进程(也称守护进程)——Linux系统启动时启动的进程,并在后台运行。
上述三种进程各有各的作用,使用场合也有所不同。
进程和作业的概念也有区别。一个正在执行的进程称为一个作业,而且作业可以包含一个或多个进程,尤其是当使用了管道和重定向命令。例如“nroff -man ps.1|grep kill|more”这个作业就启动了三个进程。
作业控制指的是控制正在运行的进程的行为。比如,用户可以挂起一个进程,等一会儿再继续执行该进程。shell将记录所有启动的进程情况,在每个进程过程中,用户可以任意地挂起进程或重新启动进程。作业控制是许多shell(包括bash和tcsh)的一个特性,使用户能在多个独立作业间进行切换。
一般而言,进程与作业控制相关联时,才被称为作业。
在大多数情况下,用户在同一时间只运行一个作业,即它们向shell键入的命令。使用作业控制,用户可以运行多个作业,并在需要时在这些作业间进行切换。这会有什幺用途呢?例如,当用户编辑一个文本档案,并需要中止编辑做其他事情时,利用作业控制,用户可以让编辑器暂时挂起,返回shell提示符开始做其他的事情。其他事情做完以后,用户可以重新启动挂起的编辑器,返回到刚才中止的地方,就象用户从来没有离开编辑器一样。这只是一个例子,作业控制还有许多其他实际的用途。
启动进程
键入需要运行的程式的程式名,执行一个程式,其实也就是启动了一个进程。在Linux系统中每个进程都具有一个进程号,用于系统识别和调度进程。启动一个进程有两个主要途径手工启动和调度启动,后者是事先进行设定,根据用户要求自行启动。
手工启动
由用户输入命令,直接启动一个进程便是手工启动进程。但手工启动进程又可以分为很多种,根据启动的进程类型不同、性质不同,实际结果也不一样,下面分别介绍。
1. 前台启动
这或许是手工启动一个进程的最常用的方式。一般地,用户键入一个命令“ls –l”,这就已经启动了一个进程,而且是一个前台的进程。这时候系统其实已经处于一个多进程状态。或许有些用户会疑惑我只启动了一个进程而已。但实际上有许多运行在后台的、系统启动时就已经自动启动的进程正在悄悄运行着。还有的用户在键入“ls –l”命令以后赶紧使用“ps –x”查看,却没有看到ls进程,也觉得很奇怪。其实这是因为ls这个进程结束太快,使用ps查看时该进程已经执行结束了。如果启动一个比较耗时的进程:
find / -name fox.jpg
然后再把该进程挂起,使用ps查看,就会看到一个find进程在里面。
2. 后台启动
直接从后台手工启动一个进程用得比较少一些,除非是该进程甚为耗时,且用户也不急着需要结果的时候。假设用户要启动一个需要长时间运行的格式化文本档案的进程。为了不使整个shell在格式化过程中都处于“瘫痪”状态,从后台启动这个进程是明智的选择。
[例1]
$ troff –me notes > note_form &
[1] 4513
$
由上例可见,从后台启动进程其实就是在命令结尾加上一个&号。键入命令以后,出现一个数字,这个数字就是该进程的编号,也称为PID,然后就出现了提示符。用户可以继续其他工作。
上面介绍了前、后台启动的两种情况。实际上这两种启动方式有个共同的特点,就是新进程都是由当前shell这个进程产生的。也就是说,是shell创建了新进程,于是就称这种关係为进程间的父子关係。这里shell是父进程,而新进程是子进程。一个父进程可以有多个子进程,一般地,子进程结束后才能继续父进程;如果是从后台启动,那就不用等待子进程结束了。
一种比较特殊的情况是在使用管道符的时候。例如
nroff -man ps.1|grep kill|more
这时候实际上是启动了三个进程。请注意是启动的,所有放在管道两边的进程都将被启动,它们都是当前shell的子程式,互相之间可以称为兄弟进程。
以上介绍的是手工启动进程的一些内容,作为一名系统管理员,很多时候都需要把事情安排好以后让其自动运行。因为管理员不是机器,也有离开的时候,所以有些必须要做的工作而恰好管理员不能亲自操作,这时候就需要使用调度启动进程了。
调度启动
有时候需要对系统进行一些比较费时而且占用资源的维护工作,这些工作适合在深夜进行,这时候用户就可以事先进行调度安排,指定任务运行的时间或者场合,到时候系统会自动完成这一切工作。
要使用自动启动进程的功能,就需要掌握以下几个启动命令。
at命令
用户使用at命令在指定时刻执行指定的命令序列。也就是说,该命令至少需要指定一个命令、一个执行时间才可以正常运行。at命令可以只指定时间,也可以时间和日期一起指定。需要注意的是,指定时间有个系统判别问题。比如说用户现在指定了一个执行时间凌晨3:20,而发出at命令的时间是头天晚上的20:00,那幺究竟是在哪一天执行该命令呢?如果用户在3:20以前仍然在工作,那幺该命令将在这个时候完成;如果用户3:20以前就退出了工作状态,那幺该命令将在第二天凌晨才得到执行。下面是at命令的语法格式
at [-V] [-q 伫列] [-f 档案名称] [-mldbv] 时间
at -c 作业 [作业...]
at允许使用一套相当複杂的指定时间的方法,实际上是将POSIX.2标準扩展了。它可以接受在当天的hh:mm(小时:分钟)式的时间指定。如果该时间已经过去,那幺就放在第二天执行。也可以使用midnight(深夜),noon(中午),teatime(饮茶时间,一般是下午4点)等比较模糊的词语来指定时间。用户还可以採用12小时计时制,即在时间后面加上AM(上午)或者PM(下午)来说明是上午还是下午。
也可以指定命令执行的具体日期,指定格式为month day(月 日)或者mm/dd/yy(月/日/年)或者dd.mm.yy(日.月.年)。指定的日期必须跟在指定时间的后面。
上面介绍的都是绝对计时法,其实还可以使用相对计时法,这对于安排不久就要执行的命令是很有好处的。指定格式为now + count time-units ,now就是当前时间,time-units是时间单位,这里可以是 minutes(分钟)、hours(小时)、days(天)、weeks(星期)。count是时间的数量,究竟是几天,还是几小时,等等。
还有一种计时方法就是直接使用today(今天)、tomorrow(明天)来指定完成命令的时间。下面通过一些例子来说明具体用法。
[例2] 指定在今天下午5:30执行某命令。假设现在时间是中午12:30,1999年2月24日,其命令格式如下
at 5:30pm
at 17:30
at 17:30 today
at now + 5 hours
at now + 300 minutes
at 17:30 24.2.99
at 17:30 2/24/99
at 17:30 Feb 24
以上这些命令表达的意义是完全一样的,所以在安排时间的时候完全可以根据个人喜好和具体情况自由选择。一般採用绝对时间的24小时计时法可以避免由于用户自己的疏忽造成计时错误的情况发生,例如上例可以写成
at 17:30 2/24/99
这样非常清楚,而且别人也看得懂。
对于at命令来说,需要定时执行的命令是从标準输入或者使用-f选项指定的档案中读取并执行的。如果at命令是从一个使用su命令切换到用户shell中执行的,那幺当前用户被认为是执行用户,所有的错误和输出结果都会送给这个用户。如果有邮件送出的话,收到邮件的将是原来的用户,也就是登录时shell的所有者。
[例3]
$ at -f work 4pm + 3 days
在三天后下午4点执行档案work中的作业。
$ at -f work 10am Jul 31
在7月31日上午10点执行档案work中的作业。
在任何情况下,超级用户都可以使用这个命令。对于其他用户来说,是否可以使用就取决于两个档案/etc/at.allow和/etc/at.deny。如果/etc/at.allow档案存在的话,那幺只有在其中列出的用户才可以使用at命令;如果该档案不存在,那幺将检查/etc/at.deny档案是否存在,在这个档案中列出的用户均不能使用该命令。如果两个档案都不存在,那幺只有超级用户可以使用该命令;空的/etc/at.deny档案意味着所有的用户都可以使用该命令,这也是默认状态。
下面对命令中的参数进行说明。
-V 将标準版本号列印到标準错误中。
-q queue 使用指定的伫列。伫列名称是由单个字母组成,合法的伫列名可以由a-z或者A-Z。a伫列是at命令的默认伫列。
-m 作业结束后传送邮件给执行at命令的用户。
-f file 使用该选项将使命令从指定的file读取,而不是从标準输入读取。
-l atq命令的一个别名。该命令用于查看安排的作业序列,它将列出用户排在伫列中的作业,如果是超级用户,则列出伫列中的所有工作。
命令的语法格式如下:
atq [-V] [-q 伫列] [-v]
-d atrm 命令的一个别名。该命令用于删除指定要执行的命令序列,语法格式如下
atrm [-V] 作业 [作业...]
-c 将命令行上所列的作业送到标準输出。
[例4] 找出系统中所有以txt为后缀名的档案,并且进行列印。列印结束后给用户foxy发出邮件通知取件。指定时间为十二月二十五日凌晨两点。
键入
$ at 2:00 12/25/99
然后系统出现at>提示符,等待用户输入进一步的信息,也就是需要执行的命令序列
at> find / -name “.txt”|lpr
at> echo “foxyAll texts have been printed.You can take them over.Good day!River” |mail -s ”job done” foxy
输入完每一行指令然后回车,所有指令序列输入完毕后,使用组合键结束at命令的输入。这时候萤幕将出现如下信息
warning:command will be executed using /bin/sh.
job 1 at 1999-12-25 02:00
提醒用户将使用哪个shell来执行该命令序列。 实际上如果命令序列较长或者经常被执行的时候,一般都採用将该序列写到一个档案中,然后将档案作为at命令的输入来处理。这样不容易出错。
例5] 上面的例子可以修改如下
将命令序列写入到档案/tmp/printjob,语句为
$ at -f /tmp/printjob 2:00 12/25/99
这样一来,at命令将使用档案中的命令序列,萤幕显示如下
Warning:command will be executed using /bin/sh.
job 2 at 1999-12-25 02:00
也可以採用以下命令
$ at< /tmp/printjob 2:00 12/25/99
来完成同样的任务。也就是使用输入重定向的办法将档案定向为命令输入。
batch命令
batch 用低优先权运行作业,该命令几乎和at命令的功能完全相同,唯一的区别在于,at命令是在指定时间,很精确的时刻执行指定命令;而batch却是在系统负载较低,资源比较空闲的时候执行命令。该命令适合于执行占用资源较多的命令。
batch命令的语法格式也和at命令十分相似,即
batch [-V] [-q 伫列] [-f 档案名称] [-mv] [时间]
具体的参数解释请参考at命令。一般地说,不用为batch命令指定时间参数,因为batch本身的特点就是由系统决定执行任务的时间,如果用户再指定一个时间,就失去了本来的意义。
[例6] 使用例4,键入
$ batch
at> find / -name .txt|lpr
at> echo “foxyAll texts have been printed.You can take them over.Good day!River” |mail -s ”job done” foxy
现在这个命令就会在合适的时间进行了,进行完后会发回一个信息。
仍然使用组合键来结束命令输入。而且batch和at命令都将自动转入后台,所以启动的时候也不需要加上&符号。
cron命令
前面介绍的两条命令都会在一定时间内完成一定任务,要注意它们都只能执行一次。也就是说,当指定了运行命令后,系统在指定时间完成任务,一切就结束了。在很多时候需要不断重複一些命令,比如某公司每周一自动向员工报告头一周公司的活动情况,这时候就需要使用cron命令来完成任务了。
实际上,cron命令是不应该手工启动的。cron命令在系统启动时就由一个shell脚本自动启动,进入后台(所以不需要使用&符号)。一般的用户没有运行该命令的许可权,虽然超级用户可以手工启动cron,不过还是建议将其放到shell脚本中由系统自行启动。
cron命令会搜寻/var/spool/cron目录,寻找以/etc/passwd档案中的用户名命名的crontab档案,被找到的这种档案将载入记忆体。例如一个用户名为foxy的用户,它所对应的crontab档案就应该是/var/spool/cron/foxy。也就是说,以该用户命名的crontab档案存放在/var/spool/cron目录下面。cron命令还将搜寻/etc/crontab档案,这个档案是用不同的格式写成的。
cron启动以后,它将检查是否有用户设定了crontab档案,如果没有就转入“休眠”状态,释放系统资源。所以该后台进程占用资源极少。它每分钟“醒”过来一次,查看当前是否有需要运行的命令。命令执行结束后,任何输出都将作为邮件传送给crontab的所有者,或者是/etc/crontab档案中MAILTO环境变数中指定的用户。
上面简单介绍了一些cron的工作原理,cron命令的执行不需要用户干涉;需要用户修改的是crontab中要执行的命令序列,所以下面介绍crontab命令。
crontab命令
crontab命令用于安装、删除或者列出用于驱动cron后台进程的表格。也就是说,用户把需要执行的命令序列放到crontab档案中以获得执行。每个用户都可以有自己的crontab档案。下面就来看看如何创建一个crontab档案。
在/var/spool/cron下的crontab档案不可以直接创建或者直接修改。crontab档案是通过crontab命令得到的。现在假设有个用户名为foxy,需要创建自己的一个crontab档案。可以使用任何文本编辑器建立一个新档案,然后向其中写入需要运行的命令和要定期执行的时间。
然后存档退出。假设该档案为/tmp/test.cron。再后就是使用crontab命令来安装这个档案,使之成为该用户的crontab档案。键入
crontab test.cron
这样一个crontab 档案就建立好了。可以转到/var/spool/cron目录下面查看,发现多了一个foxy档案。这个档案就是所需的crontab 档案。用more命令查看该档案的内容可以发现档案头有三行信息
#DO NOT EDIT THIS FILE -edit the master and reinstall.
#(test.cron installed on Mon Feb 22 14:20:20 1999)
#(cron version --$Id:crontab.c,v 2.13 1994/01/17 03:20:37 vivie Exp $)
大概意思是
#切勿编辑此档案——如果需要改变请编辑源档案然后重新安装。
#test.cron档案安装时间14:20:20 02/22/1999
如果需要改变其中的命令内容时,还是需要重新编辑原来的档案,然后再使用crontab命令安装。
可以使用crontab命令的用户是有限制的。如果/etc/cron.allow档案存在,那幺只有其中列出的用户才能使用该命令;如果该档案不存在但cron.deny档案存在,那幺只有未列在该档案中的用户才能使用crontab命令;如果两个档案都不存在,那就取决于一些参数的设定,可能是只允许超级用户使用该命令,也可能是所有用户都可以使用该命令。
crontab命令的语法格式如下
crontab [-u user] file
crontab [-u user]{-l|-r|-e}
第一种格式用于安装一个新的crontab 档案,安装来源就是file所指的档案,如果使用“-”符号作为档案名称,那就意味着使用标準输入作为安装来源。
-u 如果使用该选项,也就是指定了是哪个具体用户的crontab 档案将被修改。如果不指定该选项,crontab 将默认是操作者本人的crontab ,也就是执行该crontab 命令的用户的crontab 档案将被修改。请注意,如果使用了su命令再使用crontab 命令很可能就会出现混乱的情况。所以如果是使用了su命令,最好使用-u选项来指定究竟是哪个用户的crontab档案。
-l 在标準输出上显示当前的crontab。
-r 删除当前的crontab档案。
-e 使用VISUAL或者EDITOR环境变数所指的编辑器编辑当前的crontab档案。当结束编辑离开时,编辑后的档案将自动安装。
[例7]
# crontab -l #列出用户目前的crontab。
10 6 date
0 /2 date
0 23-7/2,8 date
#
在crontab档案中如何输入需要执行的命令和时间。该档案中每行都包括六个域,其中前五个域是指定命令被执行的时间,一个域是要被执行的命令。每个域之间使用空格或者制表符分隔。格式如下
minute hour day-of-month month-of-year day-of-week commands
第一项是分钟,第二项是小时,第三项是一个月的第几天,第四项是一年的第几个月,第五项是一周的星期几,第六项是要执行的命令。这些项都不能为空,必须填入。如果用户不需要指定其中的几项,那幺可以使用代替。因为是统配符,可以代替任何字元,所以就可以认为是任何时间,也就是该项被忽略了。在表4-1中给出了每项的合法範围。
表4-1 指定时间的合法範围
时间
合法值
minute 00-59
hour 00-23,其中00点就是晚上12点
day-of-month
01-31
month-of-year
01-12
day-of-week
0-6,其中周日是0
这样用户就可以往crontab 档案中写入无限多的行以完成无限多的命令。命令域中可以写入所有可以在命令行写入的命令和符号,其他所有时间域都支持列举,也就是域中可以写入很多的时间值,只要满足这些时间值中的任何一个都执行命令,每两个时间值中间使用逗号分隔。
[例8]
5,15,25,35,45,55 16,17,18 command
这就是表示任意天任意月,其实就是每天的下午4点、5点、6点的5 min、15 min、25 min、35 min、45 min、55 min时执行命令。
[例9]
在每周一,三,五的下午300系统进入维护状态,重新启动系统。那幺在crontab 档案中就应该写入如下栏位
00 15 1,3,5 shutdown -r +5
然后将该档案存档为foxy.cron,再键入crontab foxy.cron安装该档案。
[例10]
每小时的10分,40分执行用户目录下的innd/bbslin这个指令
10,40 innd/bbslink
[例11]
每小时的1分执行用户目录下的bin/account这个指令
1 bin/account
[例12]
每天早晨三点二十分执行用户目录下如下所示的两个指令(每个指令以;分隔)
20 3 (/bin/rm -f expire.ls logins.bad;bin/expire>expire.1st)
[例13]
每年的一月和四月,4号到9号的3点12分和3点55分执行/bin/rm -f expire.1st这个指令,并把结果添加在mm.txt这个档案之后(mm.txt档案位于用户自己的目录位置)。
12,55 3 4-9 1,4 /bin/rm -f expire.1st>> m.txt
[例14]
我们来看一个超级用户的crontab档案
#Run the ‘atrun’ program every minutes
#This runs anything that’s due to run from ‘at’.See man ‘at’ or ‘atrun’. 0,5,10,15,20,25,30,35,40,45,50,55 /usr/lib/atrun
40 7 updatedb
8,10,22,30,39,46,54,58 /bin/sync
进程的挂起及恢复命令bg、fg
作业控制允许将进程挂起并可以在需要时恢复进程的运行,被挂起的作业恢复后将从中止处开始继续运行。只要在键盘上按,即可挂起当前的前台作业。
[例15]
$ cat >
< ctrl+z>
text.file [1] + stopped cat > text.file
$ jobs [1]+ stopped cat >text.file
在键盘上按后,将挂起当前执行的命令cat。使用jobs命令可以显示shell的作业清单,包括具体的作业、作业号以及作业当前所处的状态。
恢复进程执行时,有两种选择用fg命令将挂起的作业放回到前台执行;用bg命令将挂起的作业放到后台执行。
[例16]
用户正在使用Emacs,突然需要查看系统进程情况。就使用组合键将Emacs进程挂起,然后使用bg命令将其在后台启动,这样就得到了前台的操作控制权,接着键入“ps –x”查看进程情况。查看完毕后,使用fg命令将Emacs带回前台运行即可。其命令格式为
< ctrl+z>
$ bg emacs
$ ps –x
$ fg emacs
默认情况下,fg和bg命令对最近停止的作业进行操作。如果希望恢复其他作业的运行,可以在命令中指定要恢复作业的作业号来恢复该作业。例如
$ fg 1
cat > text.file
灵活使用上述命令,将给自己带来很大的方便。