Nagios的安装与使用详细教程

Nagios简介

  Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

  Nagios原名为NetSaint,由Ethan Galstad开发并维护至今。NAGIOS是一个缩写形式: "Nagios Ain't Gonna Insist On Sainthood" Sainthood 翻译为圣徒,而"Agios"是"saint"的希腊表示方法。Nagios被开发在Linux下使用,但在Unix下也工作得非常好。

主要功能

网络服务监控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH)主机资源监控(CPU load、disk usage、system logs),也包括Windows主机(使用NSClient++ plugin)可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……)可以通过配置Nagios远程执行插件远程执行脚本远程监控支持SSH或SSL加通道方式进行监控简单的plugin设计允许用户很容易的开发自己需要的检查服务,支持很多开发语言(shell scripts、C++、Perl、ruby、Python、PHP、C#等)包含很多图形化数据Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等)可并行服务检查能够定义网络主机的层次,允许逐级检查,就是从父主机开始向下检查当服务或主机出现问题时发出通告,可通过email, pager, sms 或任意用户自定义的plugin进行通知能够自定义事件处理机制重新激活出问题的服务或主机自动日志循环支持冗余监控包括Web界面可以查看当前网络状态,通知,问题历史,日志文件等

支持短信,邮件通知

Nagios官网 http://www.nagios.org

1. Nagios安装 - 服务端(192.168.0.11)

Centos6默认的yum源里没有nagios相关的rpm包,但是我们可以安装一个epel的扩展源:

代码如下:

yum install -y epel-release

然后安装nagios相关的包

代码如下:

yum install -y httpd nagios nagios-pluginsnagios-plugins-all nrpe nagios-plugins-nrpe

设置登录nagios后台的用户和密码:htpasswd -c /etc/nagios/passwd nagiosadmin

代码如下:

nagios -v /etc/nagios/nagios.cfg 检测配置文件

启动服务:service httpd start; servicenagios start

浏览器访问:http://ip/nagios

vim /etc/nagios/nagios.cfg  #暂时先不管

2. Nagios安装 - 客户端(192.168.0.12)

在客户端机器上

代码如下:

yum install -y epel-release
yum install -y nagios-plugins nagios-plugins-allnrpe nagios-plugins-nrpe
vim /etc/nagios/nrpe.cfg  找到“allowed_hosts=127.0.0.1” 改为“allowed_hosts=127.0.0.1,192.168.0.11”   #服务器的ip
找到” dont_blame_nrpe=0” 改为  “dont_blame_nrpe=1”

启动客户端 /etc/init.d/nrpe start

3. 监控中心(192.168.0.11)添加被监控主机(192.168.0.12)

代码如下:

vim /etc/nagios/conf.d/192.168.0.12.cfg                 
define host{
        use                   linux-server           
       host_name          192.168.0.12
       alias                      0.12
       address                192.168.0.12
        }
define service{
        use                   generic-service
       host_name              192.168.0.12              
       service_description     check_ping
       check_command          check_ping!100.0,20%!200.0,50%      #0是ok,20是警告,50是危险
        max_check_attempts5                    #单位是秒数
       normal_check_interval 1
}
define service{
        use                   generic-service
       host_name              192.168.0.12
       service_description     check_ssh
       check_command          check_ssh
       max_check_attempts      5    ;当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数值为1,那么检测到问题立即告警
       normal_check_interval 1   ;重新检测的时间间隔,单位是分钟,默认是3分钟
       notification_interval          60 ;在服务出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间。单位是分钟。如果你认为,所有的事件只需要一次通知就够了,可以把这里的选项设为0。
}
define service{
        use                   generic-service
       host_name              192.168.0.12
       service_description     check_http
       check_command          check_http
        max_check_attempts     5
       normal_check_interval 1
}

以上普通服务不依赖于客户端nrpe服务,我们可以想象,我们在自己电脑上可以使用ping或者telnet探测远程任何一台机器是否存活、是否开启某个端口或服务。而当我们想要检测客户端上的某个具体特殊服务的情况时,就需要借助于nrpe了,比如想知道客户端机器的负责或磁盘使用情况。

4.  继续添加服务

增加:

代码如下:

define command{
       command_name    check_nrpe    #去对方获得服务状态,可自定义
       command_line    $USER1$/check_nrpe -H $HOSTADDRESS$-c $ARG1$
        }

继续编辑

代码如下:

vim/etc/nagios/conf.d/192.168.0.12.cfg

增加如下内容:

代码如下:

define service{
        use    generic-service
       host_name       192.168.0.12
       service_description     check_load
       check_command          check_nrpe!check_load
       max_check_attempts 5
       normal_check_interval 1
}
define service{
        use    generic-service
       host_name       192.168.0.12
       service_description     check_disk_hda1
       check_command          check_nrpe!check_hda1
       max_check_attempts 5
       normal_check_interval 1
}
define service{
        use    generic-service
       host_name       192.168.0.12
       service_description     check_disk_hda2
       check_command          check_nrpe!check_hda2    #这个不要写错,是对应客户端的
       max_check_attempts 5
       normal_check_interval 1
}

说明:  check_nrpe!check_load:这里的check_nrpe就是在commands.cfg刚刚定义的,check_load是远程主机上的一个检测脚本

在客户端上vim/etc/nagios/nrpe.cfg 搜索check_load,这行就是在服务端上要执行的脚本了,我们可以手动执行这个脚本
把check_hda1更改一下:/dev/hda1 改为 /dev/sda1

再加一行command[check_hda2]=/usr/lib/nagios/plugins/check_disk-w 20% -c 10% -p /dev/sda2  # w = warnning
c = critial

Crital不能比warning的值大

机制:首先在服务端定义check_nrpe命令,再通过check_nrpe后面跟的command(客户端的nrpe.cfg里)

客户端上重启一下nrpe服务: service nrpe restart
服务端也重启一下nagios服务: service nagios restart

5.   配置告警

代码如下:

vim /etc/nagios/objects/contacts.cfg //增加:
define contact{
        contact_name                               
       use                           generic-contact
        alias                         aming
        email             @qq.com
        }
define contact{
        contact_name             
        use                           generic-contact
        alias                          aaa
        email             wsw@.com
        }
define contactgroup{                         #定义联系组
        contactgroup_name          common
        alias                                common
        members                        ,
        }

然后在要需要告警的服务里面加上contactgroup

代码如下:

define service{
        use    generic-service
       host_name       192.168.0.12
       service_description     check_load
       check_command          check_nrpe!check_load
       max_check_attempts 5
       normal_check_interval 1
        contact_groups       common                  #监控哪个发邮件
       notifications_enabled  1    ;是否开启提醒功能。
1为开启,0为禁用。一般,这个选项会在主配置文件(nagios.cfg)中定义,效果相同。
        notification_period  24x7   ;发送提醒的时间段。非常重要的主机(服务)我定义为7×24,一般的主机(服务)就定义为上班时间。如果不在定义的时间段内,无论什么问题发生,都不会发送提醒。      
       notification_options:w,u,c,r   ;这个是service的状态。w为waning, u为unknown, c为critical, r为recover(恢复了),类似的还有一个  host对应的状态:d,u,r   d = 状态为DOWN, u = 状态为UNREACHABLE , r = 状态恢复为OK,需要加入到host的定义配置里。
}

6.   配置图形显示 pnp4nagios

(1)安装

代码如下:

yum install pnp4nagios rrdtool

(2)配置主配置文件

代码如下:

vim /etc/nagios/nagios.cfg  //修改如下配置
  process_performance_data=   
  host_perfdata_command=process-host-perfdata
  service_perfdata_command=process-service-perfdata
  enable_environment_macros=

(3)修改commands.cfg

vim/etc/nagios/objects/commands.cfg  //注释掉原有对process-host-perfdata和process-service-perfdata,重新定义

代码如下:

define command { 
        command_name    process-service-perfdata 
        command_line    /usr/bin/perl/usr/libexec/pnpnagios/process_perfdata.pl 
  }     
  define command {  
  command_name    process-host-perfdata 
        command_line    /usr/bin/perl/usr/libexec/pnpnagios/process_perfdata.pl -d HOSTPERFDATA 
  }

(4)修改配置文件templates.cfg

代码如下:

vim /etc/nagios/objects/templates.cfg definehost {
        name      hosts-pnp
       register   0
        action_url/pnp4nagios/index.php/graph?host=$HOSTNAME$&srv=_HOST_
       process_perf_data              1
}
define service {
        name      srv-pnp
       register   0
        action_url/pnp4nagios/index.php/graph?host=$HOSTNAME$&srv=$SERVICEDESC$
       process_perf_data              1
}

(5)修改host和service配置

代码如下:

vim /etc/nagios/conf.d/192.168.0.12.cfg
把 “define host{
        use                   linux-server”

改为:

代码如下:

define host{
        use                   linux-server,hosts-pnp

修改对应的service,比如

代码如下:

define service{
        use    generic-service
       host_name       192.168.0.12
       service_description     check_disk_hda1
       check_command          check_nrpe!check_hda1
       max_check_attempts 5
       normal_check_interval 1
}

改为:

代码如下:

define service{
        use    generic-service,srv-pnp
       host_name       192.168.0.12
       service_description     check_disk_hda1
       check_command          check_nrpe!check_hda1
       max_check_attempts 5
       normal_check_interval 1
}

(6)重启和启动各个服务:

代码如下:

service nagios restart
service httpd restart
service npcd start

(7) 访问测试

两种访问方法:

代码如下:

ip/nagios/
ip/pnp4nagios/

以上所述是小编给大家分享的Nagios的安装与使用详细教程,希望对大家有所帮助。

(0)

相关推荐

  • 基于Linux下Nagios的安装与配置说明介绍[图]

    一.Nagios简介 Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows.Linux和Unix的主机状态,交换机路由器等网络设置,打印机等.在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知. Nagios原名为NetSaint,由Ethan Galstad开发并维护至今.NAGIOS是一个缩写形式: "Nagios Ain't Gonna Insist On Sainthood" Sainthood 翻译为圣徒

  • Nagios远程监控安装与配置详解图文第1/3页

    作为系统管理员,我最担心那些重要的在线系统在我不知情的情况下停机或者停止网络服务,而且那些发生故障的服务或主机有时候可能要好长一段时间才知道.尤其是遇到节假日,系统管理员就很紧张.要改变这种被动局面,这里我推荐网络监控软件Nagios,个人认为它最大的好处是可以发故障报警短信-只要Nagios监控的对象发生故障,系统就会自动发送短信到手机上.下面摘录Nagios官方网站的描述: Nagios is an open source host, service and network monitori

  • MySQL性能监控软件Nagios的安装及配置教程

    Nagios是一款Linux上成熟的监视系统运行状态和网络信息的开原IT基础设施监视系统,Nagios能监视所指定的本地或远程主机及服务,例如HTTP服务.FTP服务等,同时提供异常通知.事件处理等功能,当主机或服务出现故障时,Nagios还可以通过邮件.手机短信等形式在第一时间进行通知.Nagios可运行在Linux和Unix平台上,同时提供一个可选的基于浏览器的Web界面,方便系统管理员查看系统的运行状态.网络状态.各种系统问题及日志异常等. 环境: 192.168.0.201      m

  • Nagios的安装与使用详细教程

    Nagios简介 Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows.Linux和Unix的主机状态,交换机路由器等网络设置,打印机等.在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知. Nagios原名为NetSaint,由Ethan Galstad开发并维护至今.NAGIOS是一个缩写形式: "Nagios Ain't Gonna Insist On Sainthood" Sainthood 翻译为圣徒,而

  • centos 6.9安装mysql的详细教程

    1.确认mysql是否已安装,有下面的代码可知 [root@cdh1 zjl]# yum list installed mysql* Loaded plugins: fastestmirror, refresh-packagekit, security Loading mirror speeds from cached hostfile * base: mirrors.zju.edu.cn * extras: mirrors.aliyun.com * updates: mirrors.aliyu

  • Ajenti开源免费的服务器管理面板和Ajenti V虚拟主机面板及安装与使用详细教程

    Ajenti是国外一个功能非常强大的轻型的Linux服务器管理面板,采用Python架构,修改扩展非常简单,包含了Apache.计划任务(Cron).文件系统.防火墙.MySQL.Nginx.Munin.Samba.FTP和Squid等多个实用插件,比较适合搭建小型的服务器管理环境. Ajenti V是Ajenti一个虚拟主机管理面板插件,有点类似于Webmin下的Virtualmin,Ajenti V可以用于创建和管理虚拟主机,方便建站,管理网站运维.Ajenti可以添加Widget,方便你快

  • CentOs7.x安装Mysql的详细教程

    CentOS7的yum源中默认好像是没有MySQL的.为了解决这个问题,我们要先下载mysql的repo源. 1. 下载mysql的repo源 $ wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm 2. 安装mysql-community-release-el7-5.noarch.rpm包 $ sudo rpm -ivh mysql-community-release-el7-5.noarch.rpm 安装这个

  • Windows(x86,64bit)升级MySQL 5.7.17免安装版的详细教程

    MySQL需要升级到5.5.3以上版本才支持Laravel 5.4默认的utf8mb64字符编码.因此就把MySQL升级了一下,期间还是遇到些小问题,记录一下以供参考. 升级准备 备份之前MySql目录下的data目录(数据库目录). MySql官网下载MySQL 5.7.17版本压缩包. 管理员身份运行命令行,输入net stop mysql命令,停止mysql服务. 输入sc delete mysql命令,删除mysql服务. 卸载当前版本MySQL. 开始升级 解压MySQL 5.7.17

  • CentOS6.4 下安装SVN的详细教程(超详细)

    1.检查系统是否已经安装如果安装就卸载 rpm -qa subversion yum remove subversion 2.安装 yum install subversion 3.建立SVN库 mkdir -p /home/svn/repos svnadmin create /home/svn/repos 执行上面的命令后,自动建立repositories库,查看/home/svn/repos 文件夹发现包含了conf, db,format,hooks, locks, README.txt等文

  • linux下使用cmake编译安装mysql的详细教程

    一.安装cmake 1.解压cmake压缩包 [root@mysql tools]# tar -zvxf cmake-2.8.8.tar.gz [root@mysql tools]# ls cmake-2.8.8 cmake-2.8.8.tar.gz mysql-5.5.16.tar.gz scripts 2.解析 [root@mysql tools]# cd cmake-2.8.8 [root@mysql cmake-2.8.8]# ./configure ------------------

  • mysql8.0.18下安装winx64的详细教程(图文详解)

    到网站 https://dev.mysql.com/downloads/mysql/ 下载MySQL数据库 解压后进入目录 D:\Program Files\mysql-8.0.18 创建my.ini文件 [mysql] # 设置mysql客户端默认字符集 default-character-set=utf8mb4 [mysqld] # 设置3306端口 port = 3306 # 设置mysql的安装目录 basedir=D:\\Program Files\\mysql-8.0.18 # 设置

  • Ubuntu 18.04上安装 phpMyAdmin的详细教程

    我们将安装 phpMyAdmin 在 Ubuntu18.04 上配合 Apache 一起工作. 在安装 phpMyAdmin 之前需要已经安装了LAMP栈并提供了web页面. 如果没有安装可以参照 Ubuntu 18.04上安装Apache,MySQL,PHP 来先安装. 1. 安装 phpMyAdmin 让我们从更新包列表开始,并在Ubuntu 18.04上安装phpMyAdmin.下面我们有两个用&&分隔的命令.第一个命令将更新包列表,以确保您获得phpMyAdmin的最新版本和依赖项

  • 在VMware上 安装 centos8的详细教程

    centos官网地址 https://www.centos.org/ 首先下载好自己需要的文件 开始安装 安装过程比较多,很多都是直接点击下一步即可,这里只说一些需要注意的地方 首先第一步这里要选择自定义安装,典型安装暂时不支持centos8 这里选择稍后安装操作系统 由于VMware Workstation 现在还没有直支持安装centos8,所以这里选择red hat enterprise linux 8 64位 选择自己的安装位置 后面的很多这里根据自己的需求选择,大部分可以直接下一步就行

随机推荐