系统运维管理是许多公司在维护软件系统中非常重要的工作内容。
今天,我们就一起来了解一下,在运维过程中都有哪些工具是需要我们掌握和使用的。
1、对服务器安全和监控,可以推荐一些开源工具吗?监控好像也就nagios,cacti,zabbix,还有其他可以推荐的吗?安全方面如何监控?监控工具各有侧重点,zabbix同时支持snmp和自己的agent,也支持自定义模板,在大部分场景下都是不错的选择。
另外,不要把zabbix视为只能监控服务器信息,通过自定义模板,也可以监控业务层面的指标。
安全监控分为主动检测,如TenableNessus,以及IDS、IPS。
2、Linux运维中,服务器版本都用什么版本?CentOS5还是CentOS6、Ubuntu?为什么选择这个版本?有做哪些测试?目前我们以CentOS6.X为主。
不同Linux分支各有特点,比如Ubuntu新版本发布较快,如果追求内核版本升级速度的话,可以考虑。
CentOS一直是我们的主要Linux发行版,主要是考虑到它的稳定性以及熟悉程度高。
3、对于使用缓存有什么推荐吗?一般就Redis,Codis。
还有那些比较好用的开源软件?对于类似session-id这样的可以非持久存储的数据,可以考虑memcached,使用一致性哈希算法分布式存储。
4、做自动化发布,除了Jenkins持续集成工具,还有那些好用的工具呢?目前我所知道的,一般都是Hudson或者Jenkins,后者是前者分支出来的。
这些工具都有丰富的插件,灵活使用这些插件是关键所在。
5、问个MySQL问题,三个版本(MySQL(官方版本)、PerconaServer、MariaDB)您建议使用哪个版本,原因是?我们团队一般使用的是官方版本。
烟台北大青鸟http://www.kmbdqn.cn/认为主要是考虑到支持和生态。
6、服务器日志收集和分析有什么好工具推荐吗?ELK貌似有点复杂,不太会用,有其他的推荐么?ELK确实是目前使用比较广泛的日志收集和分析的工具。
虽然有些学习成本,但还是值得去研究和尝试的。
作为一种将算法集成到工具里的新型运维方式,AIOps 可以帮助企业最大程度地简化运维工作,把 IT 从耗时又容易出错的流程中解放出来。
有了 AIOps,当 IT 出现故障隐患,运维人员不需要再等待系统发出故障告警,通过内置的机器学习算法以及大数据技术,就能自动发现系统的各类异常,从而实现从异常入手判断故障发生的可能性、严重性和影响,依赖机器对数据的分析结果,判断最佳的应对方案。
由此可以看出,基于 AIOps 的管理方法对监控式运维的底层技术实现了颠覆。传统 IT 运维管理工具更为关注突发事件(即告警)、配置和性能,而 AIOps 则更加关注问题、分析和预测,二者可谓互相补充相得益彰。
对 IT 运维人员而言,当一条告警被确认的时候,不但意味着你第一时间发现了业务故障,更意味着在故障发生的这一刻,业务已经受到了影响。而随着 AIOps 的出现,IT 部门可以通过机器学习和算法技术,事先发现 IT 系统的运行异常,提前进行故障的防范甚至规避措施,确保业务故障不出现或者少出现,这些对于 IT 和业务部门来说意义重大。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)