如何使用iostat查看linux硬盘IO性能

2025-01-31 22:12:29

TOP 观察：IO等待所占用的CPU时间的百分比，高过30%时IO压力高其次、用iostat -x 1 10

[root@controller ~]#iostat -d -k 1 10
Device:     tps  kB_read/s  kB_wrtn/s  kB_read  kB_wrtn
sda       19.00     0.00    112.00     0    112
sda1       0.00     0.00     0.00     0     0
sda2       0.00     0.00     0.00     0     0
sda3       0.00     0.00     0.00     0     0
sda4       0.00     0.00     0.00     0     0
sda5       3.00     0.00    16.00     0     16
sda6       0.00     0.00     0.00     0     0
sda7      16.00     0.00    96.00     0    96

tps:该设备每秒的传输次数，一次传输的意思是“一次I/O请求”

kB_read/s：每秒从设备读取的数据量
kB_wrtn/s：每秒向设备写入的数据量
kB_read：读取的总数据量
kB_wrtn ：写入的总数量数据量

使用-x获得更多信息

查看设备使用率（%util）、响应时间（await）

[root@controller ~]#iostat -d -x -k 1 10
Device:     rrqm/s  wrqm/s  r/s  w/s   rkB/s  wkB/s  avgrq-sz avgqu-sz  await svctm %util
sda        0.00    22.00 0.00 18.00   0.00  160.00  17.78   0.07     3.78  3.78  6.80
sda1       0.00    0.00  0.00 0.00   0.00   0.00   0.00    0.00     0.00  0.00  0.00
sda2       0.00    0.00  0.00 0.00   0.00   0.00   0.00    0.00     0.00  0.00  0.00
sda3       0.00    15.00 0.00 2.00   0.00   68.00  68.00    0.01     6.50  6.50  1.30
sda4       0.00    0.00  0.00 0.00   0.00   0.00   0.00    0.00     0.00  0.00  0.00
sda5       0.00    0.00  0.00 0.00   0.00   0.00   0.00    0.00     0.00  0.00  0.00
sda6       0.00    0.00  0.00 0.00   0.00   0.00   0.00    0.00     0.00  0.00  0.00
sda7       0.00   7.00 0.00 16.00   0.00  92.00  11.50   0.06    3.44  3.44  5.50

rrqm/s:每秒进行merge的读操作数目。即delta(rmerge)/s
wrqm/s:每秒进行merge的写操作数目。即delta(wmerge)/s
r/s:每秒完成的读I/O设备次数。即delta(rio)/s
w/s:每秒完成的写I/O设备次数。即delta(wio)/s
rsec/s:每秒读扇区数。即delta(rsect)/s
wsec/s:每秒写扇区数。即delta(wsect)/s
rkB/s:每秒读K字节数。是rsect/s的一半，因为每扇区大小为512字节。(需要计算)
wkB/s:每秒写K字节数。是wsect/s的一半。(需要计算)
avgrq-sz:平均每次设备I/O操作的数据大小(扇区)。delta(rsect+wsect)/delta(rio+wio)
avgqu-sz:平均I/O队列长度。即delta(aveq)/s/1000(因为aveq的单位为毫秒)。
await:平均每次设备I/O操作的等待时间(毫秒)。即delta(ruse+wuse)/delta(rio+wio)
svctm:平均每次设备I/O操作的服务时间(毫秒)。即delta(use)/delta(rio+wio)
%util:一秒中有百分之多少的时间用于I/O操作，或者说一秒中有多少时间I/O队列是非空的。即delta(use)/s/1000(因为use的单位为毫秒)

如果%util接近100%，说明产生的I/O请求太多，I/O系统已经满负荷，该磁盘
可能存在瓶颈。

idle小于70%IO压力就较大了,一般读取速度有较多的wait.

同时可以结合vmstat查看查看b参数()和wa参数()

另外还可以参考

svctm 一般要小于await(因为同时等待的请求的等待时间被重复计算了)，svctm 的大小一般和磁盘性能有关，CPU/内存的负荷也会对其有影响，请求过多也会间接导致svctm的增加。await 的大小一般取决于服务时间(svctm)以及I/O队列的长度和I/O请求的发出模式。如果svctm比较接近await，说明I/O 几乎没有等待时间；如果await远大于svctm，说明I/O 队列太长，应用得到的响应时间变慢，如果响应时间超过了用户可以容许的范围，这时可以考虑更换更快的磁盘，调整内核elevator 算法，优化应用，或者升级CPU。

队列长度(avgqu-sz)也可作为衡量系统I/O负荷的指标，但由于avgqu-sz是按照单位时间的平均值，所以不能反映瞬间的I/O洪水。

别人一个不错的例子.(I/O系统vs.超市排队)

举一个例子，我们在超市排队checkout时，怎么决定该去哪个交款台呢?首当是看排的队人数，5个人总比20人要快吧? 除了数人头，我们也常常看看前面人购买的东西多少，如果前面有个采购了一星期食品的大妈，那么可以考虑换个队排了。还有就是收银员的速度了，如果碰上了连钱都点不清楚的新手，那就有的等了。另外，时机也很重要，可能5 分钟前还人满为患的收款台，现在已是人去楼空，这时候交款可是很爽啊，当然，前提是那过去的5分钟里所做的事情比排队要有意义 (不过我还没发现什么事情比排队还无聊的)。

I/O系统也和超市排队有很多类似之处:

r/s+w/s类似于交款人的总数
平均队列长度(avgqu-sz)类似于单位时间里平均排队人的个数
平均服务时间(svctm)类似于收银员的收款速度
平均等待时间(await)类似于平均每人的等待时间
平均I/O数据(avgrq-sz)类似于平均每人所买的东西多少
I/O操作率(%util)类似于收款台前有人排队的时间比例。

我们可以根据这些数据分析出I/O请求的模式，以及I/O的速度和响应时间。

%util：在统计时间内所有处理IO时间，除以总共统计时间。例如，如果统计间隔1秒，该设备有0.8秒在处理IO，而0.2秒闲置，那么该设备的%util = 0.8/1 = 80%，所以该参数暗示了设备的繁忙程度。一般地，如果该参数是100%表示设备已经接近满负荷运行了（当然如果是多磁盘，即使%util是100%，因为磁盘的并发能力，所以磁盘使用未必就到了瓶颈）。
)

部署一个程序时（我测试的是一个实时上传日志的程序），对系统的cpu、内存、io等都要有所考虑，保证系统高效的运行。

如果程序本身处理的包特别小，事件很多，压力大且没有间隔的话，占用CPU的资源会很多

如果用磁盘缓存，不用内存缓存的话，能够支持断点重传，保证数据的可靠性上传，如突然断电等情况，存入磁盘缓存的数据等到恢复后会依然上传，而不会丢失，但是相对的也会增加读写磁盘的次数，如果数据量比较小，速度还是可以忍受的。

下面是别人写的这个参数输出的分析

# iostat -x 1
avg-cpu: %user  %nice  %sys  %idle
16.24  0.00  4.31  79.44
Device:        rrqm/s wrqm/s  r/s  w/s   rsec/s wsec/s  rkB/s wkB/s  avgrq-sz avgqu-sz  await svctm %util
/dev/cciss/c0d0   0.00  44.90  1.02 27.55  8.16 579.59   4.08  289.80  20.57  22.35    78.21  5.00 14.29
/dev/cciss/c0d0p1 0.00  44.90   1.02 27.55  8.16 579.59   4.08  289.80  20.57  22.35    78.21  5.00 14.29
/dev/cciss/c0d0p2 0.00  0.00 0.00 0.00  0.00  0.00   0.00   0.00   0.00   0.00  0.00  0.00  0.00

上面的iostat输出表明秒有28.57次设备I/O操作:总IO(io)/s=r/s(读)+w/s(写)=1.02+27.55=28.57(次/秒)其中写操作占了主体(w:r=27:1)。

平均每次设备I/O操作只需要5ms就可以完成，但每个I/O请求却需要等上78ms，为什么?因为发出的I/O请求太多(每秒钟约29个)，假设这些请求是同时发出的，那么平均等待时间可以这样计算:

平均等待时间=单个I/O服务时间*(1+2+…+请求总数-1)/请求总数

应用到上面的例子:平均等待时间=5ms*(1+2+…+28)/29=70ms，和iostat给出的78ms的平均等待时间很接近。这反过来表明I/O是同时发起的。

每秒发出的I/O请求很多(约29个)，平均队列却不长(只有2个左右)，这表明这29个请求的到来并不均匀，大部分时间I/O是空闲的。

一秒中有14.29%的时间I/O队列中是有请求的，也就是说，85.71%的时间里I/O系统无事可做，所有29个I/O请求都在142毫秒之内处理掉了。

delta(ruse+wuse)/delta(io) =await=78.21=>delta(ruse+wuse)/s=78.21*delta(io)/s= 78.21*28.57=2232.8，表明每秒内的I/O请求总共需要等待2232.8ms。所以平均队列长度应为 2232.8ms/1000ms=2.23，而iostat给出的平均队列长度(avgqu-sz)却为22.35，为什么?!因为 iostat中有bug，avgqu-sz值应为2.23，而不是22.35。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我们。

Linux下挂载硬盘分区的几种方法

Linux下挂载硬盘分区的几种方法 1.使用Autofs自动挂载分区 2.修改/etc/fstab 3.编写shell脚本,开机自动运行mount命令方法一.使用Autofs 1.Autofs的特点:Autofs与Mount/Umount的不同之处在于,它是一种看守程序(deamon).如果它检测到用户正试图访问一个尚未挂接的文件系统,它就会自动检测该文件系统,如果该文件系统存在,那么Autofs会自动将其挂接.另一方面,如果它检测到某个已挂接的文件系统在一段时间内没有被使用,那么Auto
实现批量linux格式化硬盘和挂载硬盘脚本分享

复制代码代码如下: #!/bin/bash PATH=/bin:/sbin:/usr/bin:/usr/sbinexport PATH i=1while [ $i -lt 13 ] #硬盘数量,除系统盘之外是12块doj=`echo $i|awk '{printf "%c",97+$i}'` #系统盘是sda,如果是其它的需要修改脚本 parted /dev/sd$j <<FORMAT mklabel gp
详解linux添加硬盘分区挂载教程

基本步骤:分区--格式化--挂载--写入文件 1.首先用fdisk -l命令查看添加的硬盘名称,可以看到sdb为新增的硬盘 [root@oracle ~]# fdisk -l Disk /dev/sdb: 21.5 GB, 21474836480 bytes 255 heads, 63 sectors/track, 2610 cylinders Units = cylinders of 16065 * 512 = 8225280 bytes Sector size (logical/physic
详解Linux命令iostat

Linux系统出现了性能问题,一般我们可以通过top.iostat.free.vmstat等命令来查看初步定位问题.在一个以前看到系统监控工具,总在想那些监控工具的代理,如何收集系统性能信息,io性能,cpu使用,带宽使用等信息,偶然发现,不同系统均提供有性能分析工具的,代理可通过这些命令获取系统性能信息,个人猜测,不知道具体是不是这样的.其中iostat可以给我们提供丰富的IO状态数据,下边就来看一下iostat如何使用,命令能够输出那些信息. 简述 Linux系统中通过iostat我们能查看
Linux中的iostat命令使用教程

前言话说搞运维的人没有两把"刷子",都不好意思上服务器操作.还好,我还不是搞运维的,我一直都自诩是开发人员,奈何现在的东家运维人员"水"的一比,还要我这个自诩是开发的人撸起袖子亲自上阵,好吧,没有办法,重拾以前的命令,再次走起~~~ 说到运维,那就离不开监控磁盘了.而说到磁盘监控,那又不得不说道说道iostat命令了.这篇文章就对那个我曾经非常熟悉的iostat命令进行详细的总结. 命令详解 Linux系统中的iostat是I/O statistics(输入/输出
Linux下查看CPU型号,内存大小,硬盘空间的命令(详解)

1 查看CPU 1.1 查看CPU个数 # cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 2 **uniq命令:删除重复行;wc –l命令:统计行数** 1.2 查看CPU核数 # cat /proc/cpuinfo | grep "cpu cores" | uniq cpu cores : 4 1.3 查看CPU型号 # cat /proc/cpuinfo | grep 'model name' |un
linux系统下如何挂载NTFS移动硬盘

前言数据迁移是我们经常会遇到的,有时候做大数据量迁移时,为了快速迁移大数据,有可能在Linux服务器上临时挂载NTFS格式的移动硬盘, 一般情况下,Linux是识别不了NTFS格式移动硬盘的(需要重编译Linux核心才能,加挂NTFS分区), 这时候为了能让Linux服务器能够识别NTFS的移动硬盘,就必须安装ntfs-3g(Third Generation Read/Write NTFS Driver)的包. 一.NTFS-3G介绍 NTFS-3G是一个开源项目, NTFS-3G是为Linu
详解Linux下挂载新硬盘方法

Linux的硬盘识别: 一般使用"fdisk -l"命令可以列出系统中当前连接的硬盘设备和分区信息.新硬盘没有分区信息,则只显示硬盘大小信息. 1.关闭服务器加上新硬盘 2.启动服务器,以root用户登录 3.查看硬盘信息 #fdisk -l Disk /dev/sda: 42.9 GB, 42949672960 bytes 255 heads, 63 sectors/track, 5221 cylinders Units = cylinders of 16065 * 512 = 8
如何使用iostat查看linux硬盘IO性能

TOP 观察:IO等待所占用的CPU时间的百分比,高过30%时IO压力高其次.用iostat -x 1 10 [root@controller ~]#iostat -d -k 1 10 Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn sda 19.00 0.00 112.00 0 112 sda1 0.00 0.00 0.00 0 0 sda2 0.00 0.00 0.00 0 0 sda3 0.00 0.00 0.00 0 0 sda4 0.00
如何在Windows中监视IO性能

本来准备写一篇windows中监视IO性能的,后来发现好像可写的内容不多,windows在细节这方面做的不是那么的好,不过那些基本信息还是有的. 在Windows中监视性能基本都用性能监视器了,与IO性能相关的有两个大类,一个是"LogicalDisk",另外一个是"PhysicalDisk","LogicalDisk"更多的是用来监视文件相关的IO性能,而"PhysicalDisk"则是用来监视LUN或者是磁盘卷,下面就列举
Bash 脚本实现每次登录到 Shell 时可以查看 Linux 系统信息

Linux 中有很多可以查看系统信息如处理器信息.生产商名字.序列号等的命令.你可能需要执行多个命令来收集这些信息.同时,记住所有的命令和他们的选项也是有难度. 你可以写一个 shell 脚本基于你的需求来自定义显示的信息. 以前我们出于不同的目的需要写很多个 bash 脚本. 现在我们写一个新的 shell 脚本,在每次登录到 shell 时显示需要的系统信息. 这个j脚本有 6 部分,细节如下: 通用系统信息 CPU/内存当前使用情况硬盘使用率超过 80% 列出系统 WWN 详情 Ora
解析Linux高性能网络IO和Reactor模型

目录一.基本概念介绍二.网络IO的读写过程三.Linux五种网络IO模型 3.1.阻塞式I/O (blocking IO) 3.2.非阻塞式I/O (nonblocking IO) 3.3.多路复用I/O (IO multiplexing) 3.4.信号驱动式I/O (SIGIO) 3.5.异步IO (POSIX的aio_系列函数) 四.多路复用IO深入理解一波 4.1.select 4.2.epoll 4.3.epoll相比select的优点 4.4.关于epoll的IO模型是同步异步的
SQL Server中的Forwarded Record计数器影响IO性能的解决方法

一.简介最近在一个客户那里注意到一个计数器很高(Forwarded Records/Sec),伴随着间歇性的磁盘等待队列的波动.本篇文章分享什么是forwarded record,并从原理上谈一谈为什么Forwarded record会造成额外的IO. 二.存放原理在SQL Server中,当数据是以堆的形式存放时,数据是无序的,所有非聚集索引的指针存放指向物理地址的RID.当数据行中的变长列增长使得原有页无法容纳下数据行时,数据将会移动到新的页中,并在原位置留下一个指向新页的指针,这么做的
查看linux中某个端口(port)是否被占用的方法

1.使用lsof lsof -i:端口号查看某个端口是否被占用 2.使用netstat 使用netstat -anp|grep 80 以上这篇查看linux中某个端口(port)是否被占用的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
SQL Server 聚焦存储过程性能优化、数据压缩和页压缩提高IO性能方法（一）

前言关于SQL Server基础系列尚未结束,还剩下最后一点内容未写,后面会继续.有园友询问我什么时候开始写SQL Server性能系列,估计还得等一段时间,最近工作也比较忙,但是会陆陆续续的更新SQL Server性能系列,本篇作为性能系列的基本引导,让大家尝尝鲜.在涉及到SQL Server性能优化时,我看到的有些文章就是一上来列出SQL Server的性能优化条例,根本没有弄清楚为什么这么做,当然也有可能是自己弄懂了,只是作为备忘录,但是到了我这里,我会遵循不仅仅是备忘录,还要让各位园友
查看linux服务器上mysql配置文件路径的方法

在类NUIX的系统中,配置文件的位置一般在/etc/my.cnf 或者 /etc/MySQL/my.cnf 我们见过有些人尝试修改配置文件但是不生效,因为他们修改的并不是服务器读取的文件.例如Debian下,/etc/mysql/my.cnf才是MySQL读取的配置文件,而不是/etc/my.cnf. 如果不知道当前使用的配置文件路径,可以尝试下面的操作: 对于服务器上只有一个MySQL实例的典型安装,这个命令很有用以上就是小编为大家带来的查看linux服务器上mysql配置文件路径的方法全部
查看Linux内存条数与清理内存的命令方法

1.查看当前内存使用状态 free -m 或者 free -g (-m按MB查看, -g按GB查看) 2.整理内存 echo 1 > /proc/sys/vm/drop_caches 3.查看内存条数命令: dmidecode |grep -A16 "Memory Device$" 以上就是小编为大家带来的查看Linux内存条数与清理内存的命令方法全部内容了,希望大家多多支持我们~
查看linux文件系统块大小的实现方法

在linux系统上,可以用命令tune2fs ,测试如下 [root@localhost test10g]# tune2fs -help tune2fs 1.35 (28-Feb-2004) tune2fs: invalid option -- h Usage: tune2fs [-c max-mounts-count] [-e errors-behavior] [-g group] [-i interval[d|m|w]] [-j] [-J journal-options] [-l] [-s

如何使用iostat查看linux硬盘IO性能

相关推荐

随机推荐