几十台到几千台服务器的运维监控该怎么做?需要注意什么?

几十台到几千台服务器的运维监控该怎么做?需要注意什么?,第1张

随着市场竞争力不断增大,各个企业除了要增加自身产品的竞争力之外,也越来越重视消费者的服务,毕竟大家的生活质量在提高,每个产品也都相差不大,而服务就变成了用户最值得考虑的一个因素,也更好的体现了品牌的价值。这就要求公司进入了几十台到几千台服务器的运维监控阶段,无论数量如何增加,保持服务器的稳定才是重中之重,在服务器数量少于200台的时候,主要考虑简单使用、稳定运行、报警这三个方面,一旦大于这个数量,就需要相应的提升技术手段了。

基本上200台以下的服务器运营监控就是小白级操作了,如果出现一些异常系统可以第一时间进行报警,并且帮助用户解决问题,这也是最基础的要求,基本上哪怕是新手适当的进行学习就可以操作成功。而当服务器数量从200增加到1000这个阶段,这意味着用户的需求也在变复杂,那么技术人员就需要将监控内容进行统一,实现全覆盖式的监控管理,确保每一个用户出现问题时,都没有漏报的现象。

而当服务器超过1000台以上时,监控的数量越来越多,消费者的告警信息也会急速增长,每天都会收到成百上千的用户需要解决问题的消息,如果系统不进行相关的整理的话,很容易忽略到消费者的消息,从而带来非常不好的体验,这个时候就需要及时对报警信息进行相应的整理,尽量的化繁为简,减少出现重复报警的情况。并且对于内存使用率、CPU使用率等模块进行独立的设置,做到权责分明、快速定位、及时处理。

综上所述,每个公司的业务不同,那么对于服务器的要求也不太同,不论发生怎么样的变化,基本上只要有了相关的监控数据,就能够通过技术来分析出想要的结果,想要随着时代一起进步,就需要不断的更新维护、高效运维。

Windows服务器的监控方式有三种,分别为Agent监测方式、SNMP监测方式和WMI监测方式,下面分别对每一种监测方式进行介绍:

Agent监测方式

使用Agent方式来采集数据,首先需要在被监测服务器上安装Windows Agent代理程序,安装过程请参考安装Agent代理。

1、登录CreCloud云网管平台后,点击系统右上方的【监测】按钮,再点击左下方的【设备管理】。右键点击【设备管理】树下的【设备列表】,弹出菜单。

(也可在设备列表的空白处【图标视图】和【详细信息】中右键选择【增加管理对象】或在快速工具栏中点击【增加管理对象】,下同)

2、选择【增加管理对象】,弹出【添加管理对象】对话框,在【全部设备】下看到“AgentWindows”。

选中上图中的【AgentWindows】,点击【确定】,弹出【AgentWindows】对话框,如下图所示(也可左键双击【AgentWindows】弹出下面对话框)。

3、在“基本设置”栏下进行设置:

Windows服务器地址:输入被监测的服务器的IP地址

Agent端口号:Agent端口,默认为2198

标题:填写显示的标题,可以自己定义

是否禁止:禁止则不进行监测

监测服务器:默认即可

4、在“高级设置”栏可以对该管理对象进行详细描述以及设置依靠条件,如下图:

依靠:从下拉列表中选择要依靠的监测点,可以设置多个监测点依靠。

描述:填写对该设备的简单描述,可以不填写。

5、“基本设置”和“高级设置”填写完毕,点击【确定】即可,弹出显示正在获取管理对象属性提示框。如果获取正常,就会弹出【配置监测点】对话框。

勾选要监测的选项后,点击右边的【确定】即可,Agent监测方式添加完成。添加完成后,在【设备管理】的树下和设备列表的图标视图中都会有添加的设备显示。

SNMP监测方式

注意:如果采用SNMP方式监控,请检查远程机器的SNMP协议是否打开 。

1、登录CreCloud云网管平台后,点击系统右上方的【监测】按钮。

再点击左下方的【设备管理】,如下图所示:

2、右键点击【设备管理】树下的【设备列表】,弹出菜单,如下图所示:

3、选择【增加管理对象】,弹出【添加管理对象】对话框,在【全部设备】下选择设备类型为“SNMP Windows”,点击【确定】,如下图所示:

4、选择“SNMP Windows”,点击【确定】后,弹出如下图所示对话框:

5、“基本设置”选项卡:

Windows服务器IP:填写被监测服务器的IP地址

SNMP端口号:填写SNMP的端口号

可读共同体名称:填写SNMP的可读共同体名称

标题:填写显示的标题

监测服务器:默认即可

6、“高级设置”选项卡:

该选项卡中的设置和Agent中的设置相同。

点击【确定】后,SNMP Windows的监测方式添加完成。添加完成后在设备管理中设备列表下和右侧【设备列表】的图标视图中都会有该设备。

WMI监测方式

注意:如果用WMI方式,需要安装WMI和服务

1、用WMI方式监测,需要将CreCloud Task Server 服务改为用管理员用户启动。

CreCloud Task Server 服务右键“属性”,选择“登录”选项卡

登录帐户选择“此帐户”,点击“浏览”按钮,弹出“选择用户”窗口

点击“高级”按钮后,点击“一般性查询”右侧的“立即查找”按钮,在下方查询结果中选择“Administartor”用户后确定

返回到属性窗口,点击确认,并重启CreCloud Task Server服务

2、登录CreCloud云网管平台后,点击系统右上方的【监测】按钮。

再点击左下方的【设备管理】,如下图所示:

3、右键点击【设备管理】树下的【设备列表】,弹出菜单,如下图所示:

4、选择【增加管理对象】,弹出【添加管理对象】对话框,在【全部设备】下选择设备类型为“WMI Windows”,点击【确定】,如下图所示:

点击【确定】后,弹出如下图对话框:

5、“基本设置”选项卡

Windows服务器IP:填写被监测的服务器的IP地址

登录名:填写被监测的服务器的系统管理员名称

服务器工作状态可以通过不同方式监控。

SNMP和IPMI都是可以的。但是由于很多服务器的数据非常重要,而利用接口的方式监控有被黑客攻击的风险。

现在银行系统、金融等系统很多采用一种称之为“神鹰光眼”的方式监控服务器状态指示灯。用以向监控系统实时报告服务器的运行状态。由于其采用了最新的光纤技术,与服务器之间物理隔绝。因此系统的安全性得以保障。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/21360.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-02-15
下一篇2023-02-15

发表评论

登录后才能评论

评论列表(0条)

    保存