1. 自动监控:云监控服务不需要开通,监控服务会根据您创建的弹性云服务器资源或者弹性伸缩等自动启动。用户在创建和使用云服务后可直接到云监控服务查看该服务运行状态并设置告警规则。
2. 主机监控:通过在弹性云服务或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁盘等40余种监控指标。
3. 灵活配置告警规则:对监控指标设置告警规则时,支持对多个云服务资源同时添加告警规则。告警规则创建完成后,可随时修改告警规则,支持对告警规则进行启用、停止、删除等灵活操作。
4. 实时通知:通过在告警规则中开启消息通知服务,当云服务的状态变化触发告警规则设置的阈值时,系统通过短信、邮件通知或发送消息至服务器地址等多种方式实时通知用户,让用户能够实时掌握云资源运行状态变化。
5. 监控面板:为用户提供在一个监控面板跨服务、跨维度查看监控数据,将用户关注的重点服务监控指标集中呈现,既能满足您总览云服务的运行概况,又能满足排查故障时查看监控详情的需求。
6. OBS转储:云监控服务各监控指标的原始数据的保留周期为两天,超过保留周期后原始数据将不再保存。您开通对象存储服务(Object Storage Service,以下简称OBS)后,可将原始数据同步保存至OBS,以保存更长时间。
常用的性能指标【吞吐量】 固定时间间隔内的处理完毕事务个数。通常是1秒内处理完毕的请求个数,单位:事务/秒(tps)。
【平均吞吐量】一段时间内吞吐量的平均值。无法体现吞吐量的瞬间变化。
【峰值吞吐量】一段时间内吞吐量的最大值。是用来评估系统容量的重要指标之一。
【最低吞吐量】一段时间内吞吐量的最小值。如果最小值接近0,说明系统有“卡”的现象。
【70%的吞吐量集中区间】通过统计15%和85%的吞吐量边界值,计算出70%的吞吐量集中区间。区间越集中,吞吐量越稳定。
【响应时间】一次事务的处理时间。通常指从一个请求发出,到服务器进行处理后返回,再到接收完毕应答数据的时间间隔,单位:毫秒。
【平均响应时间】 一段时间内响应时间的平均值。无法体现响应时间的波动情况。
【中间响应时间】一段时间内响应时间的中间值,50%响应时间,有一半的服务器响应时间低于该值而另一半高于该值。
【90%响应时间】一段时间内90%的事务响应时间比此数值要小。反应总体响应速度,和高于该值的10%超时率。是用来评估系统容量的重要指标之一。
【最小响应时间】响应时间的最小值。反映服务最快处理能力。
【最大响应时间】响应时间的最大值。反映服务器最慢处理能力。
【CPU占用率】1-CPU空闲率,表示CPU被使用情况,反映了系统资源利用情况。
对于游戏开发者的实际情况来说,充足的测试时间并不是每次都可以保证的,而且对于模拟机器人的开发过程本身又是一个很大的投入。这里再推荐一个压测工具,云端IDE内置了对HTTP、标准TCP和PB协议的解析器,无需写脚本,只需要编写自定义协议就行了,链接:http://wetest.qq.com/gaps/
主机侦探:性能优化的前提是发现问题,定位性能瓶颈,确定优化方向。完备的性能监控指标是前提。服务器性能监控主要分为两个层次:应用层面的监控和系统层面的监控。
关于服务器更多相关可以看下主机侦探上面的相关介绍。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)