服务器性能指标_服务器知识

负载(load)是linux机器的一个重要指标，直观了反应了机器当前的状态。

来看下负载的定义是怎样的：

In UNIX computing, the system load is a measure of the amount of computational work that a computer system performs. The load average represents the average system load over a period of time. It conventionally appears in the form of three numbers which represent the system load during the last one-, five-, and fifteen-minute periods.（wikipedia）

Unix refers to this as the run-queue length: the sum of the number of processes that are currently running plus the number that are waiting (queued) to run.

Free memory is the amount of memory which is currently not used for anything. This number should be small, because memory which is not used is simply wasted.

Available memory is the amount of memory which is available for allocation to a new process or to existing processes。

查看磁盘使用情况，通常看磁盘大小和inode使用率：

磁盘性能分析

r/s 和 w/s：每秒磁盘读写的次数。这两个值相加就是 tps。

rkB/s 和 wkB/s：每秒磁盘读写的数据量。

avgrq-sz：平均每次读写磁盘扇区的大小。

avgqu-sze：平均 IO 队列长度。队列长度越短越好。

await：平均每次磁盘读写的等待时间（ms）。

svctm：平均每次磁盘读写的服务时间（ms）。

%util：一秒钟有百分之多少的时间用于磁盘读写操作。

1）%util：衡量 IO 的繁忙程度

这个值越大，说明产生的 IO 请求较多，IO 压力较大，

我们可以结合 %idle 参数来看，如果 %idle <70% 就说明 IO 比较繁忙了。

2）await：衡量 IO 的响应速度

通俗理解，await 就像我们去医院看病排队等待的时间，

这个值和医生的服务速度（svctm）和你前面排队的人数（avgqu-size）有关。

如果 svctm 和 await 接近，说明磁盘 IO 响应时间较快，排队较少，

如果 await 远大于 svctm，说明此时队列太长，响应较慢，

这时可以考虑换性能更好的磁盘。

带宽：表示链路的最大传输速率，单位通常为 b/s （比特 / 秒）

延时：表示从网络请求发出后，一直到收到远端响应，所需要的时间延迟

在不同场景中，这一指标可能会有不同含义

比如，它可以表示，建立连接需要的时间（比如 TCP握手延时）

或一个数据包往返所需的时间（比如 RTT）

PPS：是 Packet Per Second（包 / 秒）的缩写，表示以网络包为单位的传输速率�丢包率：丢包百分比

重传率：重新传输的网络包比例

连接数状态：TCP 各状态连接数量

TIME_WAIT状态存在有两个原因。

第一个是防止来自一个连接的延迟段被误解为后续连接的一部分。

连接处于2MSL等待状态时到达的所有流量都将被丢弃。

该TIME_WAIT状态的第二个原因是

可靠地实现TCP的全双工连接终止。

如果最后的ACK被丢弃，那么端点2将重新发送最后的FIN

单机最大连接数理论限制

系统用一个4四元组来唯一标识一个TCP连接： �{local ip, local port, remote ip, remote port}。 �

因此本地端口个数最大只有65536，端口0有特殊含义，不能使用，

这样可用端口最多只有65535，

所以在全部作为client端的情况下，

最大tcp连接数为65535，这些连接可以连到不同的server ip

1、系统最大打开文件数

sys.fs.files.max//系统最大文件句柄数

/proc/sys/fs/file-max

2、单进程最大文件描述符

echo 2000000 >/proc/sys/fs/nr_open

sysctl -w fs.nr_open=100000000

3、某个用户下的某个进程的文件打开数

ulimit –n [num]

ulimit -n unlimited

/etc/security/limits.conf

worker soft nofile 102400

worker hard nofile 409600

linux内核通过进程标识值(process identification value)-PID来标示进程，

PID是一个数，类型位pid_t, 实际上就是int类型

查看

可以使用cat /proc/sys/kernel/pid_max来查看系统中可创建的进程数实际值

修改

1、ulimit -u 65535

2、我们在Linux还需要设置内核参数kernel.pid_maxsysctl -w kernel.pid_max=65535

参照此表，您可以估算出服务器在繁忙时段的平均扩展系数，并且还可以为 Server_Transinfo_Range 设定合理的数值，以此得到一个比较理想的服务器可用性指标。以下内容节选自 Domino Administrator 6.5.1 帮助文档。集群中的每个服务器都定期判断自己的工作负载，判断将基于服务器最近处理请求的响应时间作出。系统用 0 到 100 之间的数字表示工作负载，其中 0 表示服务器负载过重100 表示服务器负载很轻。这个数值称为服务器的可用性指标。随响应时间增加，服务器可用性指标减小。服务器的可用性指标约等于仍然可用的总服务器容量百分比。例如，如果服务器的可用性指标为 65，则仍然有 65% 的服务器容量可用。尽管企业中的服务器功率和资源可能不同，但每台服务器上的服务器可用性指标都代表同一件事 -- 仍然可用的服务器容量。服务器可用性指标基于扩展系数生成，用于指示服务器上的当前工作负载。扩展系数是由特定类型事件的响应时间与服务器曾经完成此类事务的最短时间之比决定的。例如，如果服务器当前执行“打开数据库”事务的平均时间为 12 毫秒，而服务器曾经执行“打开数据库”事务的最短时间为 3 毫秒，则“打开数据库”事务的扩展系数为 4（当前时间 12 毫秒除以最快时间 3 毫秒）。换言之，扩展系数决定完成当前事务所花的时间是在最佳条件下所花时间的多少倍。IBM(R) Domino(TM) 将每种事务的最短时间存储在内存和 LOADMON.NCF 文件中，服务器每次启动时都会读取该时间。服务器关机时，Domino 会用最新信息更新 LOADMON.NCF 文件。为确定当前的扩展系数，Domino 会在指定的时间段内跟踪最常用的几种 Domino 事务类型。缺省情况下，Domino 会在 5 个时间段内跟踪这些事务，每段时间为 15 秒。然后，Domino 就可以确定完成每种事务平均要花的时间，并用该时间除以它曾经完成每种同类事务所花的最短时间。这样就可确定每种事件的扩展系数。为确定整个服务器的扩展系数，Domino 会取所有类型事务的扩展系数的平均值，并对最常用的事务类型给予较大的加权数。当服务器繁忙时，对服务器添加更多负载会显著地影响服务器的性能和可用性。因此，向繁忙的服务器中添加负载也比向不繁忙的服务器中添加负载要更快地增大扩展系数。因为各个服务器的速度、容量和处理能力各不相同，能够处理的工作负载也不尽相同。所以，两个不同服务器的扩展系数相同并不一定意味着二者能够承担相当的工作负载。例如，对于一个在空闲状态下执行事务都需要花费很长时间的小型服务器来说，扩展系数 40 可能表示用户需要等待若干秒才能得到响应。而对于一个处理速度非常快的超大型服务器来说，扩展系数 400 可能表示用户只需等待不到一秒的时间就能得到响应。注意：下表中的值是根据扩展系数 64 生成的，该值表示服务器处于满负载状态。扩展系数可用性指标 1<nozeros>100<nozeros>2<nozeros>83<nozeros>4<nozeros>67<nozeros>8<nozeros>50<nozeros>16<nozeros>33<nozeros>32<nozeros>17<nozeros>64<nozeros>0<nozeros>注意：扩展系数和可用性指标仅用于度量服务器响应时间，该时间通常只是客户机经历的响应时间的一小部分。例如，客户机和服务器之间的网络响应时间通常占客户机经历的响应时间的很大部分。更改表示服务器处于满负载状态的扩展系数值要有效利用 Domino 工作负载平衡，必须调整扩展系数与可用性指标之间的关系，以便服务器在达到预期的故障转移工作负载时进行故障转移。通过指定表示服务器处于满负载状态的扩展系数值，可以实现此目的。Domino 中的缺省值为 64。当扩展系数达到该值时，便可将服务器视为负载已满，可用性指标降为 0（零）。如果服务器的功能特别强大，处理速度特别快，则可提高表示服务器处于满负载状态的扩展系数值。对于一些处理速度极快的服务器来说，该值可以提高到几百或更高。如果服务器的处理速度特别慢，则可降低该值。要更改表示满负载服务器的扩展系数值，请将下面的设置添加到 NOTES.INI 文件，然后重新启动服务器。SERVER_TRANSINFO_RANGE= n 其中，值 n 表示服务器处于满负载状态的扩展系数值等于 2 的 n 次幂。 n 的缺省值为 6，这说明扩展系数值为 64，因为 2 的 6 次幂为 64如果将 SERVER_TRANSINFO_RANGE 设为 7，则满负载时的扩展系数值为 128如果将 SERVER_TRANSINFO_RANGE 设为 8，则该值为 256。要确定 SERVER_TRANSINFO_RANGE 的最优值，请执行下列操作：1. 在服务器负载过重的期间内，监控服务器的扩展系数。可以使用控制台命令“show stat server.expansionfactor”来执行此任务。另外，还可以在这些期间内监控性能统计信息。记录有关此类期间的足够多的扩展系数值，以便确定使用哪个扩展系数值来表示服务器处于满负载状态。 2. 为 SERVER_TRANSINFO_RANGE 确定一个值，以 2 为底数, 该值为指数计算而得的值，即为在步骤 1 中选择的扩展系数值。如果更改了表示服务器处于满负载状态的扩展系数值，扩展系数与可用性指标之间的关系就会发生变化。下表列出了当 SERVER_TRANSINFO_RANGE 值为 8 时的一些扩展系数以及由之转换而来的可用性指标。因为 2 的 8 次幂为 256，所以本例中的最大扩展系数为 256。扩展系数可用性指标1<nozeros>100<nozeros>2<nozeros>88<nozeros>4<nozeros>75<nozeros>8<nozeros>63<nozeros>16<nozeros>50<nozeros>32<nozeros>38<nozeros>64<nozeros>25<nozeros>128<nozeros>13<nozeros>256<nozeros>0<nozeros>更改用于计算扩展系数的数据量尽管不是必需的操作，但还是可以使用下列 NOTES.INI 设置来更改 Domino 收集用以配置扩展系数的数据量。要更改 Domino 使用的数据收集时间段数，请使用 NOTES.INI 的 Server_Transinfo_Max=x 设置，其中 x 是您希望 Domino 使用的收集时段数量。要更改每个数据收集时间段的时间长度，请使用 NOTES.INI 的 Server_Transinfo_Update_Interval=x 设置，其中 x 是每个时间段的长度（秒）。

你说的那个指标是访问许可有每服务器和每客户机两种许可是要购买的一般来说如果网络中只有一台服务器把许可证放在服务器端有一台以上的服务器把许可证放在服务器端我们可以从这几个方面来衡量服务器是否达到了其设计目的；R：Reliability——可靠性；A：Availability——可用性；S：Scalability——可扩展性；U：Usability——易用性； M：Manageability——可管理性，即服务器的RASUM衡量标准。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/146973.html

服务器性能指标

发表评论

评论列表（0条）