服务器性能指标_服务器知识

负载(load)是linux机器的一个重要指标，直观了反应了机器当前的状态。

来看下负载的定义是怎样的：

In UNIX computing, the system load is a measure of the amount of computational work that a computer system performs. The load average represents the average system load over a period of time. It conventionally appears in the form of three numbers which represent the system load during the last one-, five-, and fifteen-minute periods.（wikipedia）

Unix refers to this as the run-queue length: the sum of the number of processes that are currently running plus the number that are waiting (queued) to run.

Free memory is the amount of memory which is currently not used for anything. This number should be small, because memory which is not used is simply wasted.

Available memory is the amount of memory which is available for allocation to a new process or to existing processes。

查看磁盘使用情况，通常看磁盘大小和inode使用率：

磁盘性能分析

r/s 和 w/s：每秒磁盘读写的次数。这两个值相加就是 tps。

rkB/s 和 wkB/s：每秒磁盘读写的数据量。

avgrq-sz：平均每次读写磁盘扇区的大小。

avgqu-sze：平均 IO 队列长度。队列长度越短越好。

await：平均每次磁盘读写的等待时间（ms）。

svctm：平均每次磁盘读写的服务时间（ms）。

%util：一秒钟有百分之多少的时间用于磁盘读写操作。

1）%util：衡量 IO 的繁忙程度

这个值越大，说明产生的 IO 请求较多，IO 压力较大，

我们可以结合 %idle 参数来看，如果 %idle <70% 就说明 IO 比较繁忙了。

2）await：衡量 IO 的响应速度

通俗理解，await 就像我们去医院看病排队等待的时间，

这个值和医生的服务速度（svctm）和你前面排队的人数（avgqu-size）有关。

如果 svctm 和 await 接近，说明磁盘 IO 响应时间较快，排队较少，

如果 await 远大于 svctm，说明此时队列太长，响应较慢，

这时可以考虑换性能更好的磁盘。

带宽：表示链路的最大传输速率，单位通常为 b/s （比特 / 秒）

延时：表示从网络请求发出后，一直到收到远端响应，所需要的时间延迟

在不同场景中，这一指标可能会有不同含义

比如，它可以表示，建立连接需要的时间（比如 TCP握手延时）

或一个数据包往返所需的时间（比如 RTT）

PPS：是 Packet Per Second（包 / 秒）的缩写，表示以网络包为单位的传输速率�丢包率：丢包百分比

重传率：重新传输的网络包比例

连接数状态：TCP 各状态连接数量

TIME_WAIT状态存在有两个原因。

第一个是防止来自一个连接的延迟段被误解为后续连接的一部分。

连接处于2MSL等待状态时到达的所有流量都将被丢弃。

该TIME_WAIT状态的第二个原因是

可靠地实现TCP的全双工连接终止。

如果最后的ACK被丢弃，那么端点2将重新发送最后的FIN

单机最大连接数理论限制

系统用一个4四元组来唯一标识一个TCP连接： �{local ip, local port, remote ip, remote port}。 �

因此本地端口个数最大只有65536，端口0有特殊含义，不能使用，

这样可用端口最多只有65535，

所以在全部作为client端的情况下，

最大tcp连接数为65535，这些连接可以连到不同的server ip

1、系统最大打开文件数

sys.fs.files.max//系统最大文件句柄数

/proc/sys/fs/file-max

2、单进程最大文件描述符

echo 2000000 >/proc/sys/fs/nr_open

sysctl -w fs.nr_open=100000000

3、某个用户下的某个进程的文件打开数

ulimit –n [num]

ulimit -n unlimited

/etc/security/limits.conf

worker soft nofile 102400

worker hard nofile 409600

linux内核通过进程标识值(process identification value)-PID来标示进程，

PID是一个数，类型位pid_t, 实际上就是int类型

查看

可以使用cat /proc/sys/kernel/pid_max来查看系统中可创建的进程数实际值

修改

1、ulimit -u 65535

2、我们在Linux还需要设置内核参数kernel.pid_maxsysctl -w kernel.pid_max=65535

服务器常用性能指标如下：【吞吐量】固定时间间隔内的处理完毕事务个数。通常是1秒内处理完毕的请求个数，单位：事务/秒（tps）。【响应时间】一次事务的处理时间。通常指从一个请求发出，到服务器进行处理后返回，再到接收完毕应答数据的时间间隔，单位：毫秒。【CPU占用率】1-CPU空闲率，表示CPU被使用情况，反映了系统资源利用情况。

常用的性能指标

【吞吐量】固定时间间隔内的处理完毕事务个数。通常是1秒内处理完毕的请求个数，单位：事务/秒（tps）。

【平均吞吐量】一段时间内吞吐量的平均值。无法体现吞吐量的瞬间变化。

【峰值吞吐量】一段时间内吞吐量的最大值。是用来评估系统容量的重要指标之一。

【最低吞吐量】一段时间内吞吐量的最小值。如果最小值接近0，说明系统有“卡”的现象。

【70%的吞吐量集中区间】通过统计15%和85%的吞吐量边界值，计算出70%的吞吐量集中区间。区间越集中，吞吐量越稳定。

【响应时间】一次事务的处理时间。通常指从一个请求发出，到服务器进行处理后返回，再到接收完毕应答数据的时间间隔，单位：毫秒。

【平均响应时间】一段时间内响应时间的平均值。无法体现响应时间的波动情况。

【中间响应时间】一段时间内响应时间的中间值，50%响应时间，有一半的服务器响应时间低于该值而另一半高于该值。

【90%响应时间】一段时间内90%的事务响应时间比此数值要小。反应总体响应速度，和高于该值的10%超时率。是用来评估系统容量的重要指标之一。

【最小响应时间】响应时间的最小值。反映服务最快处理能力。

【最大响应时间】响应时间的最大值。反映服务器最慢处理能力。

【CPU占用率】1-CPU空闲率，表示CPU被使用情况，反映了系统资源利用情况。

对于游戏开发者的实际情况来说，充足的测试时间并不是每次都可以保证的，而且对于模拟机器人的开发过程本身又是一个很大的投入。这里再推荐一个压测工具，云端IDE内置了对HTTP、标准TCP和PB协议的解析器，无需写脚本，只需要编写自定义协议就行了，链接：http://wetest.qq.com/gaps/

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/508715.html

服务器性能指标

发表评论

评论列表（0条）