解决linux cpu占用不高但是负载很高

解决linux cpu占用不高但是负载很高,第1张

客户现场遇到mongodb cpu偶发性占用过高问题,配置16c16g,装了mysql,mongo,influxdb,java等应用,观察到mongodb在更新数据的时候很慢,几秒甚至几十秒。

通过vmstat 1 10发现bi很高达到2w,

top展开cpu发现有几个cpu的%wa经常在100%,初步判断硬盘负载很高,

用iostat -x 1 10果然硬盘%util达到100%了

iotop发现mysqld占用大量的io

看mysql的日志,发现有超时查询,加完索引后,系统正常。

回头看mongodb的查询慢、偶发性占用cpu 1600%只是表象,因为mongodb需要往硬盘写数据,这个时候硬盘被mysql占用,导致mongodb线程只能等io,mongodb写硬盘的请求积累,cpu也没释放,故cpu占用率高。

load负载和cpu之间关系:

参考: https://www.cnblogs.com/zhangyjblogs/p/14163576.html

linux查看磁盘io的几种方法怎样才能快速的定位到并发高是由于磁盘io开销大呢?可以通过三种方式: 第一种:用 top 命令 中的cpu 信息观察 Top可以看到的cpu信息有: Tasks: 29 total, 1 running, 28 sleeping, 0 stopped, 0 zombie Cpu(s): 0.3% us, 1.0% sy, 0.0% ni, 98.7% id, 0.0% wa, 0.0% hi, 0.0% si 具体的解释如下: Tasks: 29 total 进程总数 1 running 正在运行的进程数 28 sleeping 睡眠的进程数 0 stopped 停止的进程数 0 zombie 僵尸进程数 Cpu(s): 0.3% us 用户空间占用CPU百分比 1.0% sy 内核空间占用CPU百分比 0.0% ni 用户进程空间内改变过优先级的进程占用CPU百分比 98.7% id 空闲CPU百分比 0.0% wa 等待输入输出的CPU时间百分比 0.0% hi 0.0% si 0.0% wa 的百分比可以大致的体现出当前的磁盘io请求是否频繁。如果 wa的数量比较大,说明等待输入输出的的io比较多。 第二种:用vmstat vmstat 命令报告关于线程、虚拟内存、磁盘、陷阱和 CPU 活动的统计信息。由 vmstat 命令生成的报告可以用于平衡系统负载活动。系统范围内的这些统计信息(所有的处理器中)都计算出以百分比表示的平均值,或者计算其总和。 输入命令: vmstat 2 5 如果发现等待的进程和处在非中断睡眠状态的进程数非常多,并且发送到块设备的块数和从块设备接收到的块数非常大,那就说明磁盘io比较多。 vmstat参数解释: Procs r: 等待运行的进程数 b: 处在非中断睡眠状态的进程数 w: 被交换出去的可运行的进程数。此数由 linux 计算得出,但 linux 并不耗尽交换空间 Memory swpd: 虚拟内存使用情况,单位:KB free: 空闲的内存,单位KB buff: 被用来做为缓存的内存数,单位:KB Swap si: 从磁盘交换到内存的交换页数量,单位:KB/秒 so: 从内存交换到磁盘的交换页数量,单位:KB/秒 IO bi: 发送到块设备的块数,单位:块/秒 bo: 从块设备接收到的块数,单位:块/秒 System in: 每秒的中断数,包括时钟中断 cs: 每秒的环境(上下文)切换次数 CPU 按 CPU 的总使用百分比来显示 us: CPU 使用时间 sy: CPU 系统使用时间 id: 闲置时间 准测 更多vmstat使用信息 第二种:用iostat 安装: Iostat 是 sysstat 工具集的一个工具,需要安装。 Centos的安装方式是: yum install sysstat Ubuntu的安装方式是: aptitude install sysstat 使用: iostat -dx 显示磁盘扩展信息 root@fileapp:~# iostat -dx r/s 和 w/s 分别是每秒的读操作和写操作,而rKB/s 和wKB/s 列以每秒千字节为单位显示了读和写的数据量 如果这两对数据值都很高的话说明磁盘io操作是很频繁。+++++++++++++++++++++++++++++++++++++ linux wa%过高,iostat查看io状况 1, 安装  iostat   yum install sysstat 之后就可以使用 iostat 命令了, 2,入门使用 iostat -d -k 2 参数 -d 表示,显示设备(磁盘)使用状态;-k某些使用block为单位的列强制使用Kilobytes为单位;2表示,数据显示每隔2秒刷新一次。tps:该设备每秒的传输次数(Indicate the number of transfers per second that were issued to the device.)。"一次传输"意思是"一次I/O请求"。多个逻辑请求可能会被合并为"一次I/O请求"。"一次传输"请求的大小是未知的。kB_read/s:每秒从设备(drive expressed)读取的数据量; kB_wrtn/s:每秒向设备(drive expressed)写入的数据量; kB_read:读取的总数据量;kB_wrtn:写入的总数量数据量;这些单位都为Kilobytes。 指定监控的设备名称为sda,该命令的输出结果和上面命令完全相同。iostat -d sda 2 默认监控所有的硬盘设备,现在指定只监控sda。 3, -x 参数iostat还有一个比较常用的选项 -x ,该选项将用于显示和io相关的扩展数据。 iostat -d -x -k 1 10 输出信息的含义。4, 常见用法iostat -d -k 1 10        #查看TPS和吞吐量信息(磁盘读写速度单位为KB) iostat -d -m 2            #查看TPS和吞吐量信息(磁盘读写速度单位为MB) iostat -d -x -k 1 10      #查看设备使用率(%util)、响应时间(await) iostat -c 1 10 #查看cpu状态5, 实例分析 iostat -d -k 1 | grep vda Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn sda10            60.72        18.95        71.53  395637647 1493241908 sda10          299.02      4266.67      129.41      4352        132 sda10          483.84      4589.90      4117.17      4544      4076 sda10          218.00      3360.00      100.00      3360        100 sda10          546.00      8784.00      124.00      8784        124 sda10          827.00    13232.00      136.00      13232        136上面看到,磁盘每秒传输次数平均约400;每秒磁盘读取约5MB,写入约1MB。iostat -d -x -k 1 Device:    rrqm/s wrqm/s  r/s  w/s  rsec/s  wsec/s    rkB/s    wkB/s avgrq-sz avgqu-sz  await  svctm  %util sda          1.56  28.31  7.84 31.50  43.65    3.16    21.82    1.58    1.19    0.03    0.80  2.61  10.29 sda          1.98  24.75 419.80  6.93 13465.35  253.47  6732.67  126.73    32.15    2.00    4.70  2.00  85.25 sda          3.06  41.84 444.90 54.08 14204.08 2048.98  7102.04  1024.49    32.57    2.10    4.21  1.85  92.24 可以看到磁盘的平均响应时间<5ms,磁盘使用率>80。磁盘响应正常,但是已经很繁忙了。可以看到磁盘的平均响应时间<5ms,磁盘使用率>90。磁盘响应正常,但是已经很繁忙了。await:  每一个IO请求的处理的平均时间(单位是微秒毫秒)。这里可以理解为IO的响应时间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了 svctm    表示平均每次设备I/O操作的服务时间(以毫秒为单位)。如果svctm的值与await很接近,表示几乎没有I/O等待,磁盘性能很好, 如果await的值远高于svctm的值,则表示I/O队列等待太长,  系统上运行的应用程序将变慢。 %util: 在统计时间内所有处理IO时间,除以总共统计时间 所以该参数暗示了设备的繁忙程度 。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。 也可以使用下面的命令,同时显示cpu和磁盘的使用情况 等待时间超过5ms, 磁盘io有问题


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/689418.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-01
下一篇2023-08-01

发表评论

登录后才能评论

评论列表(0条)

    保存