代维就是代理维护的意思,是服务器运维的一种方式。
代维通常属于技术部门,与研发、测试、系统管理同为互联网产品技术支撑的4大部门,这个划分在国内和国外以及大小公司间都会多少有一些不同。
一个互联网产品的生成一般经历的过程是:产品经理、需求分析、研发部门开发、测试部门测试、运维部门部署发布以及长期的运行维护。运维,本质上是对网络、服务器、服务的生命周期各个阶段的运营与维护,在成本、稳定性、效率上达成一致可接受的状态。
运维技术方向:
产品的整个生命周期里运维的职责重要而广泛,但运维工程师们的职责不仅限于这部分工作,还需要总结工作中遇到的问题,抽取出相关的技术方向、研发相关的工具和平台以支持/优化业务的发展并提高运维的效率,相关技术工作主要包括:
1、服务监控技术:包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障;
2、服务故障管理:包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性;
3、服务容量管理:测量服务的容量,规划服务的机房建设,扩容、迁移等工作;
4、服务性能优化:从各个方向,包括网络优化、操作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验;
5、服务全局流量调度:接入服务的流量,根据容量和服务状态在各个机房间分配流量;
6、服务任务调度:服务的各种定时/非定时任务的调度触发及状态监控;
7、服务安全保障:包括服务的访问安全、防攻击、权限控制等;
8、数据传输技术:包括p2p等各类传输技术的研发应用,也远距离大数据传输等问题的解决;
9、服务自动发布部署:部署平台/工具的研发,及平台/工具的使用,做到安全、高效的发布服务;
10、服务集群管理:包括服务的服务器管理、大规模集群管理等;
11、服务成本优化:尽可能降低服务运行使用的资源,降低服务运行成本;
12、数据库管理(DBA):通过设计、开发和管理高性能数据库集群,使数据库服务更稳定、更高效、更易于管理;
13、平台化的开发:类docker和google borg平台的开发管理,及服务接入技术;
14、分布式存储平台的开发优化:类google gfs等分布式存储平台的研发及服务接入。
1. 基础理论知识
2. 基础命令(系统命令、目录管理、用户管理、文件权限、磁盘管理、资源查看等等常见操作)
3. 文本高效处理(vi、vim、awk、grep、find、sed等)
4. bash shell脚本(可以边工作边学习,使用shell编写简单的代替重复性操作的脚本)
5. 进程调度,内存管理,文件系统,外设管理等,要熟练使用相关工具,如top iotop iftop iostat vmstatss等,并且最好了解其原理
1. TCP/IP协议、DNS服务、CDN原理、iproute常见的网络客户端工具(ping、wget、ftp)
2. crontab计划任务
3. ps、top、htop、vmstat、lsof等命令
4. tcp,http,https,udp等
5. 最好能做到精通,4层,7层的网络流量分析技能要熟练掌握
6. 内部路由协议,边际路由,交换原理,域名解析,ipv6相关知识
1. MySQL各个版本之间的关系和特性
2. MySQL的安装及增删改查
3. MySQL的存储引擎
4. MySQL的优化
5. MySQL日常使用及运维,包含备份及故障排查
1. 使用shell脚本实现各种服务的自动化部署
2. 使用shell脚本实现监控系统及应用自动化
3. 使用shell脚本实现各类巡检,故障排查自动化
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)