运维的职责和过程
运维一般是指对大型组织已经建立好的网络软硬件的维护,其中传统的运维是指信息技术运维(IT运维)。所谓IT运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 运行环境(如软硬件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理。
随着信息化进程的推进,运维管理将覆盖对整个组织运行,进行支持的管理信息系统涵盖的所有内容,除了传统的IT运维,还拓展了业务运维和日常管理运维。其参与的对象也从IT部门和人员,拓展到组织的管理层和各部门,及其相关的业务骨干。
运维的最终结果是对软件运行中各种性能的维护。
职责
对于初创公司,运维部和系统部一般是合二为一的,相关工作由同一批人负责,界限可能不是很明显。大型公司对运维工作的要求更高,需要有更精细的分工,因此机房/网络/操作系统相关的底层工作分离出来由专人负责,成为系统管理部,而上层和应用产品相关的工作则由运维负责,成为运维部。以下从互联网产品生命周期和运维涉及的技术分别来看分工较细的大型互联网公司中运维工作的职责。
过程
运维的'职责覆盖了产品从设计到发布、运行维护、变更升级及至下线的生命周期,各个阶段的职责包括:
发布前
这个阶段运维工程师的职责是参与设计并把关运维准入,主要包括:
(1) 产品的业务熟悉;
(2) 产品架构设计的合理性评估,包括是否存在单点,是否可容错,是否有强耦合等,同时需要提供产品设计的合理性建议以使产品能够满足上线发布并稳定运行的基本要求;
(3) 资源评估,包括所需的服务器资源、网络资源以及资源的分布等,同时把关产品对资源预算申请的合理性,控制服务成本;
(4) 资源就位,将申请的服务器及基础环境/域名准备就位。
产品发布
这个阶段运维工程师负责发布的具体工作,将具体的软件和系统/硬件资源整合形成产品并对外提供服务。
对于已在线服务的更新也属于发布范畴,这个时候的产品发布一般要保障在线发布,在不中断对外服务的情况下完成产品的升级。对于大型复杂的变更也存在中止服务部署完成后再重新提供服务的情况,但这种情况需要运维工程师通过尽可能的技术手段来避免。
产品维护
这个阶段的主要工作包括:
(1) 监控:对服务运行的状态进行实时的监控,随时发现服务的运行异常和资源消耗情况;输出重要的日常服务运行报表以评估服务/业务整体运行状况,发现服务隐患;
(2) 故障处理:对服务出现的任何异常进行及时处理,尽可能避免问题的扩大化甚至中止服务。这之前运维工程师需要针对各类服务异常,如机房/网络故障、程序bug等问题制定处理的预案,问题出现时可以自动或手动执行预案达到止损的目的。除了日常小故障外,运维工程师还需要考虑产品不同程度受损情况下的灾难恢复,包括诸如地震等不可抗力导致大规模机房故障、在线产品被删除等对产品造成致命伤害的情况。
容量管理:包括服务规模扩张后的资源评估、扩容、机房迁移、流量调度等规划和具体实施。
产品性能
产品对外提供服务最重要的一点是用户体验,用户体验中非常重要的是产品的可用性和响应速度。而如何用最合理的资源(如机器、带宽等)支持产品提供高可用和高速度的用户体验,这也是运维工程师的重要职责。
-
面试邀请函【精品】
邀请函是商务礼仪与世俗礼仪的其中一部分。在快速变化和不断变革的今天,邀请函在活动中的使用越来越广泛,那么相关的邀请函到底怎么写呢?下面是小编为大家整理的面试邀请函,仅供参考,欢迎大家阅读。面试邀请函1您好!现诚邀您于4月29日下午来我司参加业务员岗位面试,如...
-
面试时8个最为糟糕的回答
1、我讨厌以前的老板。你的上一位老板将会是一个可怜的人,他的主要功绩似乎就是把你的生活变得苦不堪言。显然,你无需谈及这些事情。一些因过于诚实而说出的一些错误的话,尽管是令人钦佩的,然而,请你不要再犯这种错误,这些垃圾无用的谈话,是无用而让人瞧不起的。如果...
-
【热门】外企面试的五大忌讳
迟到失约守时守约在人们的日常生活中已成为起码的礼数,迟到、失约更是外企面试中的大忌。这不但会表现出求职者没有时间观念和责任感,更会让面试官觉得你对这份工作没有热忱,从而对你的第一印象大打折扣。面试官提醒求职者,去面试时最好提前10至15分钟或准时到达。...
-
面试自我评价集合14篇
在日常的学习、工作、生活中,我们最熟悉的就是自我评价了,自我评价往往折射出个人对人生自我价值和社会价值的认识和态度。如何写自我评价才合适呢?下面是小编为大家整理的面试自我评价,仅供参考,希望能够帮助到大家。面试自我评价篇1三年的锻炼,给我仅是初步的经验...