Linux中有效地管理进程的8个命令

前言

进程管理的作用:

  • 判断服务器健康状态:通过分析进程的状态(内存、CPU占有率等)判断服务器的负载和安全状态
  • 查看系统中的所有进程
  • 杀死进程

本文将给大家详细介绍关于Linux管理进程命令的相关内容,通过这些关键的命令来全程管理你的应用。

一般来说,应用程序进程的生命周期有三种主要状态:启动、运行和停止。如果我们想成为称职的管理员,每个状态都可以而且应该得到认真的管理。这八个命令可用于管理进程的整个生命周期。

启动进程

启动进程的最简单方法是在命令行中键入其名称,然后按回车键。如果要启动 Nginx web 服务器,请键入 nginx 。也许您只是想看看其版本。

alan@workstation:~$ nginx

alan@workstation:~$ nginx -v
nginx version: nginx/1.14.0

查看您的可执行路径

以上启动进程的演示是假设可执行文件位于您的可执行路径中。理解这个路径是可靠地启动和管理进程的关键。管理员通常会为他们想要的目的定制这条路径。您可以使用 echo $PATH 查看您的可执行路径。

alan@workstation:~$ echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin

WHICH

使用 which 命令查看可执行文件的完整路径。

alan@workstation:~$ which nginx
/opt/nginx/bin/nginx

我将使用流行的 web 服务器软件 Nginx 作为我的例子。假设安装了 Nginx。如果执行 which nginx 的命令什么也不返回,那么是找不到 Nginx 了,因为它只搜索您指定的可执行路径。有三种方法可以补救一个进程不能简单地通过名字启动的情况。首先是键入完整路径 —— 虽然,我不情愿输入全部路径,您会吗?

alan@workstation:~$ /home/alan/web/prod/nginx/sbin/nginx -v
nginx version: nginx/1.14.0

第二个解决方案是将应用程序安装在可执行文件路径中的目录中。然而,这有时可能是办不到的,特别是如果您没有 root 权限。

第三个解决方案是更新您的可执行路径环境变量,包括要使用的特定应用程序的安装目录。这个解决方案是与 shell 相关的。例如,Bash 用户需要在他们的 .bashrc 文件中编辑 PATH= 行。

PATH="$HOME/web/prod/nginx/sbin:$PATH"

现在,重复您的 echo 和 which 命令或者尝试检查版本。容易多了!

alan@workstation:~$ echo $PATH
/home/alan/web/prod/nginx/sbin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin

alan@workstation:~$ which nginx
/home/alan/web/prod/nginx/sbin/nginx

alan@workstation:~$ nginx -v
nginx version: nginx/1.14.0

保持进程运行

NOHUP

注销或关闭终端时,进程可能不会继续运行。这种特殊情况可以通过在要使用 nohup 命令放在要运行的命令前面让进程持续运行。此外,附加一个 & 符号将会把进程发送到后台,并允许您继续使用终端。例如,假设您想运行 myprogram.sh 。

nohup myprogram.sh &

nohup 会返回运行进程的 PID。接下来我会更多地谈论 PID。

管理正在运行的进程

每个进程都有一个唯一的进程标识号 (PID) 。这个数字是我们用来管理每个进程的。我们还可以使用进程名称,我将在下面演示。有几个命令可以检查正在运行的进程的状态。让我们快速看看这些命令。

PS

最常见的是 ps 命令。 ps 的默认输出是当前终端中运行的进程的简单列表。如下所示,第一列包含 PID。

alan@workstation:~$ ps
PID TTY   TIME CMD
23989 pts/0 00:00:00 bash
24148 pts/0 00:00:00 ps

我想看看我之前启动的 Nginx 进程。为此,我告诉 ps 给我展示每一个正在运行的进程( -e )和完整的列表( -f )。

alan@workstation:~$ ps -ef
UID  PID PPID C STIME TTY   TIME CMD
root   1  0 0 Aug18 ?  00:00:10 /sbin/init splash
root   2  0 0 Aug18 ?  00:00:00 [kthreadd]
root   4  2 0 Aug18 ?  00:00:00 [kworker/0:0H]
root   6  2 0 Aug18 ?  00:00:00 [mm_percpu_wq]
root   7  2 0 Aug18 ?  00:00:00 [ksoftirqd/0]
root   8  2 0 Aug18 ?  00:00:20 [rcu_sched]
root   9  2 0 Aug18 ?  00:00:00 [rcu_bh]
root  10  2 0 Aug18 ?  00:00:00 [migration/0]
root  11  2 0 Aug18 ?  00:00:00 [watchdog/0]
root  12  2 0 Aug18 ?  00:00:00 [cpuhp/0]
root  13  2 0 Aug18 ?  00:00:00 [cpuhp/1]
root  14  2 0 Aug18 ?  00:00:00 [watchdog/1]
root  15  2 0 Aug18 ?  00:00:00 [migration/1]
root  16  2 0 Aug18 ?  00:00:00 [ksoftirqd/1]
alan  20506 20496 0 10:39 pts/0 00:00:00 bash
alan  20520 1454 0 10:39 ?  00:00:00 nginx: master process nginx
alan  20521 20520 0 10:39 ?  00:00:00 nginx: worker process
alan  20526 20506 0 10:39 pts/0 00:00:00 man ps
alan  20536 20526 0 10:39 pts/0 00:00:00 pager
alan  20564 20496 0 10:40 pts/1 00:00:00 bash

您可以在上面 ps 命令的输出中看到 Nginx 进程。这个命令显示了将近 300 行,但是我在这个例子中缩短了它。可以想象,试图处理 300 行过程信息有点混乱。我们可以将这个输出输送到 grep ,过滤一下仅显示 nginx。

alan@workstation:~$ ps -ef |grep nginx
alan  20520 1454 0 10:39 ?  00:00:00 nginx: master process nginx
alan  20521 20520 0 10:39 ?  00:00:00 nginx: worker process

确实更好了。我们可以很快看到,Nginx 有 20520 和 20521 的 PID。

PGREP

pgrep 命令更加简化单独调用 grep 遇到的问题。

alan@workstation:~$ pgrep nginx
20520
20521

假设您在一个托管环境中,多个用户正在运行几个不同的 Nginx 实例。您可以使用 -u 选项将其他人排除在输出之外。

alan@workstation:~$ pgrep -u alan nginx
20520
20521

PIDOF

另一个好用的是 pidof 。此命令将检查特定二进制文件的 PID,即使另一个同名进程正在运行。为了建立一个例子,我将我的 Nginx 复制到第二个目录,并以相应的路径前缀启动。在现实生活中,这个实例可能位于不同的位置,例如由不同用户拥有的目录。如果我运行两个 Nginx 实例,则 pidof 输出显示它们的所有进程。

alan@workstation:~$ ps -ef |grep nginx
alan  20881 1454 0 11:18 ?  00:00:00 nginx: master process ./nginx -p /home/alan/web/prod/nginxsec
alan  20882 20881 0 11:18 ?  00:00:00 nginx: worker process
alan  20895 1454 0 11:19 ?  00:00:00 nginx: master process nginx
alan  20896 20895 0 11:19 ?  00:00:00 nginx: worker process

使用 grep 或 pgrep 将显示 PID 数字,但我们可能无法辨别哪个实例是哪个。

alan@workstation:~$ pgrep nginx
20881
20882
20895
20896

pidof 命令可用于确定每个特定 Nginx 实例的 PID。

alan@workstation:~$ pidof /home/alan/web/prod/nginxsec/sbin/nginx
20882 20881

alan@workstation:~$ pidof /home/alan/web/prod/nginx/sbin/nginx
20896 20895

TOP

top 命令已经有很久的历史了,对于查看运行进程的细节和快速识别内存消耗等问题是非常有用的。其默认视图如下所示。

top - 11:56:28 up 1 day, 13:37, 1 user, load average: 0.09, 0.04, 0.03
Tasks: 292 total, 3 running, 225 sleeping, 0 stopped, 0 zombie
%Cpu(s): 0.1 us, 0.2 sy, 0.0 ni, 99.7 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 16387132 total, 10854648 free, 1859036 used, 3673448 buff/cache
KiB Swap:  0 total,  0 free,  0 used. 14176540 avail Mem

 PID USER  PR NI VIRT RES SHR S %CPU %MEM  TIME+ COMMAND
17270 alan  20 0 3930764 247288 98992 R 0.7 1.5 5:58.22 gnome-shell
20496 alan  20 0 816144 45416 29844 S 0.5 0.3 0:22.16 gnome-terminal-
21110 alan  20 0 41940 3988 3188 R 0.1 0.0 0:00.17 top
 1 root  20 0 225564 9416 6768 S 0.0 0.1 0:10.72 systemd
 2 root  20 0  0  0  0 S 0.0 0.0 0:00.01 kthreadd
 4 root  0 -20  0  0  0 I 0.0 0.0 0:00.00 kworker/0:0H
 6 root  0 -20  0  0  0 I 0.0 0.0 0:00.00 mm_percpu_wq
 7 root  20 0  0  0  0 S 0.0 0.0 0:00.08 ksoftirqd/0

可以通过键入字母 s 和您喜欢的更新秒数来更改更新间隔。为了更容易监控我们的示例 Nginx 进程,我们可以使用 -p 选项并传递 PID 来调用 top 。这个输出要干净得多。

alan@workstation:~$ top -p20881 -p20882 -p20895 -p20896

Tasks: 4 total, 0 running, 4 sleeping, 0 stopped, 0 zombie
%Cpu(s): 2.8 us, 1.3 sy, 0.0 ni, 95.9 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 16387132 total, 10856008 free, 1857648 used, 3673476 buff/cache
KiB Swap:  0 total,  0 free,  0 used. 14177928 avail Mem

 PID USER  PR NI VIRT RES SHR S %CPU %MEM  TIME+ COMMAND
20881 alan  20 0 12016 348  0 S 0.0 0.0 0:00.00 nginx
20882 alan  20 0 12460 1644 932 S 0.0 0.0 0:00.00 nginx
20895 alan  20 0 12016 352  0 S 0.0 0.0 0:00.00 nginx
20896 alan  20 0 12460 1628 912 S 0.0 0.0 0:00.00 nginx

在管理进程,特别是终止进程时,正确确定 PID 是非常重要。此外,如果以这种方式使用 top ,每当这些进程中的一个停止或一个新进程开始时, top 都需要被告知有新的进程。

终止进程

KILL

有趣的是,没有 stop 命令。在 Linux 中,有 kill 命令。 kill 用于向进程发送信号。最常用的信号是“终止”( SIGTERM )或“杀死”( SIGKILL )。然而,还有更多。下面是一些例子。完整的列表可以用 kill -L 显示。

 1) SIGHUP  2) SIGINT  3) SIGQUIT  4) SIGILL  5) SIGTRAP
 6) SIGABRT  7) SIGBUS  8) SIGFPE  9) SIGKILL  10) SIGUSR1
11) SIGSEGV  12) SIGUSR2  13) SIGPIPE  14) SIGALRM  15) SIGTERM

注意第 9 号信号是 SIGKILL ,通常,我们会发出比如 kill -9 20896 这样的命令。默认信号是 15,这是 SIGTERM 。请记住,许多应用程序都有自己的停止方法。Nginx 使用 -s 选项传递信号,如 stop 或 reload 。通常,我更喜欢使用应用程序的特定方法来停止操作。然而,我将演示用 kill 命令来停止 Nginx 进程 20896,然后用 pgrep 确认它已经停止。PID 20896 就不再出现。

alan@workstation:~$ kill -9 20896

alan@workstation:~$ pgrep nginx
20881
20882
20895
22123

PKILL

命令 pkill 类似于 pgrep ,因为它可以按名称搜索。这意味着在使用 pkill 时必须非常小心。在我的 Nginx 示例中,如果我只想杀死一个 Nginx 实例,我可能不会选择使用它。我可以将 Nginx 选项 -s stop 传递给特定的实例来消除它,或者我需要使用 grep 来过滤整个 ps 输出。

/home/alan/web/prod/nginx/sbin/nginx -s stop
/home/alan/web/prod/nginxsec/sbin/nginx -s stop

如果我想使用 pkill ,我可以包括 -f 选项,让 pkill 过滤整个命令行参数。这当然也适用于 pgrep 。所以,在执行 pkill -f 之前,首先我可以用 pgrep -a 确认一下。

alan@workstation:~$ pgrep -a nginx
20881 nginx: master process ./nginx -p /home/alan/web/prod/nginxsec
20882 nginx: worker process
20895 nginx: master process nginx
20896 nginx: worker process

我也可以用 pgrep -f 缩小我的结果。 pkill 使用相同参数会停止该进程。

alan@workstation:~$ pgrep -f nginxsec
20881

alan@workstation:~$ pkill -f nginxsec

pgrep (尤其是 pkill )要记住的关键点是,您必须始终确保搜索结果准确性,这样您就不会无意中影响到错误的进程。

大多数这些命令都有许多命令行选项,所以我总是建议阅读每一个命令的 man 手册页 。虽然大多数这些命令都存在于 Linux、Solaris 和 BSD 等平台上,但也有一些不同之处。在命令行工作或编写脚本时,始终测试并随时准备根据需要进行更正。

via: https://opensource.com/article/18/9/linux-commands-process-management

作者: Alan Formy-Duval 选题: lujun9972 译者: heguangzhi 校对: wxy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对我们的支持。

(0)

相关推荐

  • 如何在 Linux 中查找一个命令或进程的执行时间

    在类 Unix 系统中,你可能知道一个命令或进程开始执行的时间,以及一个进程运行了多久. 但是,你如何知道这个命令或进程何时结束或者它完成运行所花费的总时长呢? 在类 Unix 系统中,这是非常容易的! 有一个专门为此设计的程序名叫 GNU time. 使用 time 程序,我们可以轻松地测量 Linux 操作系统中命令或程序的总执行时间. time 命令在大多数 Linux 发行版中都有预装,所以你不必去安装它. 在 Linux 中查找一个命令或进程的执行时间 要测量一个命令或程序的执行时间,

  • Linux/CentOS系统同步网络时间的2种方法详解

    由于硬件的原因,机器或多或少的跟标准时间对不上,一个月的误差几秒到几分钟不等.对于服务器来说时间不准,会有很多麻烦.例如,支付的时候,无法下单,游戏无法登录等. 方法一:用 ntpdate从时间服务器更新时间 如果系统没有 ntpdate 命令,可在线安装: yum -y install ntp 安装完了之后,你不要做什么配置,也不需要,直接测试一下 [root@snsgou-pc src]# date 2015年 05月 20日 星期三 22:42:19 CST [root@snsgou-pc

  • Linux 按时间批量删除文件命令(删除N天前文件)

    需要根据时间删除这个目录下的文件,/home/lifeccp/dicom/studies,清理掉20天之前的无效数据. 可以使用下面一条命令去完成: find /home/lifeccp/dicom/studies -mtime +21 -name "*.*" -exec rm -Rf {} \; 这个是根据时间删除. 下面简要解释一下,这句shell命令: find /home/lifeccp/dicom/studies -mtime +21 -name "*.*"

  • Linux date 时间设置同步命令分享

    date命令: #date 显示系统时间 hwclock命令 (即hardwareclock系统硬件时间) #hwclock 显示硬件时间 #hwclock -w 将系统时间写入到系统硬件当中 ntpdate ntpdate 是一个linux时间同步服务软件,具体的详细资料请参考下百度,有很多详细的资料 查看本机是否安装ntpdate服务,如果没有安装,请 yum install -y ntpdate 同步时间 输入ntpdate time.nist.gov同步网络时间 结果:3 Jun 15:

  • 使用iptable和Firewalld工具来管理Linux防火墙连接规则

    防火墙 防火墙是一套规则.当数据包进入或离开受保护的网络空间时,将根据防火墙规则测试数据包的内容(特别是有关其来源.目标和计划使用的协议的信息),以确定是否应该允许数据包通过.下面是一个简单的例子: 防火墙可以根据协议或基于目标的规则过滤请求. 一方面,iptables是管理Linux机器上防火墙规则的工具. 另一方面,firewalld也是管理Linux机器上防火墙规则的工具. 你对此有意见吗?如果我告诉你外面还有另一个工具,叫做nftable? 好吧,我承认整件事闻起来有点怪怪的,所以让我解

  • Linux内核设备驱动之内核的时间管理笔记整理

    /****************** * linux内核的时间管理 ******************/ (1)内核中的时间概念 时间管理在linux内核中占有非常重要的作用. 相对于事件驱动而言,内核中有大量函数是基于时间驱动的. 有些函数是周期执行的,比如每10毫秒刷新一次屏幕: 有些函数是推后一定时间执行的,比如内核在500毫秒后执行某项任务. 要区分: *绝对时间和相对时间 *周期性产生的事件和推迟执行的事件 周期性事件是由系统系统定时器驱动的 (2)HZ值 内核必须在硬件定时器的帮

  • 如何在Linux中的特定时间运行命令

    有一天,我使用 rsync 将大文件传输到局域网上的另一个系统.由于它是非常大的文件,大约需要 20 分钟才能完成.我不想再等了,我也不想按 CTRL+C 来终止这个过程.我只是想知道在 Linux 操作系统中是否有简单的方法可以在特定的时间运行一个命令,并且一旦超时就自动杀死它 -- 因此有了这篇文章.请继续阅读. 在 Linux 中在特定时间运行命令 我们可以用两种方法做到这一点. 方法 1 - 使用 timeout 命令 最常用的方法是使用 timeout 命令.对于那些不知道的人来说,t

  • 解析Linux内核的基本的模块管理与时间管理操作

    内核模块管理 Linux设备驱动会以内核模块的形式出现,因此学会编写Linux内核模块编程是学习linux设备驱动的先决条件. Linux内核的整体结构非常庞大,其包含的组件非常多.我们把需要的功能都编译到linux内核,以模块方式扩展内核功能. 先来看下最简单的内核模块 #include <linux/init.h> #include <linux/module.h> static int __init hello_init(void) { printk(KERN_ALERT &

  • Linux中可以节省你时间的15个命令别名

    前言 在管理和维护Linux系统的过程中,将会使用到大量命令,有一些很长的命令或用法经常被用到,重复而频繁地输入某个很长命令或用法是不可取的.这时可以使用命令别名功能将这个过程简单化. 在你安装的 Linux 发行版中默认就包含了一些别名. Linux 命令行别名非常适合帮助你提高工作效率.更好的是,在你安装的 Linux 发行版中默认就包含了一些别名. 这是 Fedora 27 中的命令别名的示例: 这个 alias 命令列出了已有的别名.设置别名也十分简单: alias new_name="

  • 详解linux ntp服务器时间同步设置

    linux ntp服务器时间同步设置 时间同步这个需求在很多地方都有.比如安装cm和cdh的话,需要ntp时间同步,否则会出现红色警告 这里主要是设置一台服务器作为主服务器,让其他机器同步这台机器的时间,而且是配置的本地时间,没有同步internet时间,因为很多时候服务器不能联网 首先我们这里设置2台机器,主机器为192.168.5.102,另外一台为192.168.5.103 首先设置主机器 编辑/etc/ntp.conf文件 在里面加上 restrict 127.0.0.1 # 开启内部递

  • Linux配置和使用i3窗口管理器的教程

    在本篇文章中,我将向大家展示,如何在 Fedora 28 上安装与简单配置 i3. 1.安装 首先进入 Fedora 系统中,打开一个终端.使用 dnf 来安装需要的软件包,如下: 注意:在这个命令中,我排除了 rxvt-unicode 这个包,因为我更喜欢 terminator 作为我的终端模拟器. 据用户目前的系统状态,在命令执行过程中可能会安装很多依赖.等待所有的依赖安装完成,之后重启你的电脑. 2.首次登录与初始化 在你的机器重启之后,你便可以第一次体验 i3 了.在 GNOME 显示管

随机推荐