当前位置:蚂蚁文档网 > 工作总结 > 运维项目工作总结参考

运维项目工作总结参考

时间:2022-02-24 11:36:54 浏览次数:

下面是小编为大家整理的运维项目工作总结参考,供大家参考。

运维项目工作总结参考

xxxx运维服务工作总结

目录

1概述

2011年对于XXXX来说是具有历史意义的一年,XXXX成功上线到接入第一个业务系统:集团采购门户系统,揭开了XXXXXXXX认证的一个新的篇章,XXXX公司作为XXXX的运维服务方,在历史的一年即将过去,通过对XXXX运维工作进行年度总结,从中发现工作中的不足,在以后的工作中逐渐改善。

2运维项目背景

3运维目标

XXXX公司为XXXX系统提供运行维护服务包括,XXXX软件系统、系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证XXXX 系统整体的正常运行,降低整体管理成本,提高XXXX系统的整体服务水平。同时根据日常维护的数据和记录,提供XXXX系统的整体建设规划和建议,更好的为XXXX发展提供有力的支持。

同时XXXX公司为XXXX系统提供业务协维服务,包括业务系统接入前期业务支撑、业务系统接入后期业务支撑,为业务系统提供专业的业务指引、开发指引,方便各业务系统快速接入XXXX系统。

XXXX系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。

XXXX公司通过运行维护服务的有效管理来提升XXXX系统的服务效率,结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。

XXXX公司提供的服务的目标是,对用户现有的XXXX系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映XXXX

系统资源的可用性情况和健康状况,创建一个可知可控的IT环境,从而保证XXXX系统的各类业务应用系统的可靠、高效、持续、安全运行。

4运维人员配备

XXXX运维人员梯队结构

人的因素是决定运维服务好坏的最重要的因素,合理的人力配置能够提高运维的质量和效率,保障运维工作的顺利开展, XXXX公司通过人力资源的整合与配置,形成了驻点工程师、业务协维、二线专家的人员梯队结构,更好地适应XXXX运维工作的开展。

驻点工程师担着XXXX运维工作的主动发起者的角色,通过主动对XXXX 系统,从硬件、软件各方面进行巡检,保证XXXX正常运行。

业务协维工程师站在业务的角度,解决XXXX用户的业务问题,协助XXXX公司运营人员。

二线支持为用户提供专业技术更强的技术支持服务,深入研究疑难事件和问题,并在需要提供现场服务的情况下及时到现场为用户排忧解难。

通过三方面人员间的明确分工和紧密配合,形成了较为合理的运维人力配置。

XXXX公司人员配备如下:

5运维工作总结

5.11-8月份

1月份到8月份,XXXX处于系统测试与部署阶段,XXXX公司提供的服务为系统进行全面测试、部署、业务协维、协助XXXX机房搬迁等内容,共计提供215人天运维服务工作,其中XXXX上线测试投入4人共56人天;系统部署上线共投入3人共 48人天;XXXX机房搬迁投入1人共8人天;二线支撑投入1人共83人天;XXXX系统优化投入1人共20人天。

1月2月3月4月5月6月7月8月

运维工作量按月分布图

总计(人天): 4 20 7 3 10 30 61 80 215 100% 5.1.1XXXX系统测试与部署

XXXX按照XXXX基地实际业务需求定制开发,开发项目组内部测试通过后,需提交到运维人员内部及XXXX内部进行测试验证,运维人员内部由XXXX公司的业务协维工程师和驻点工程师3人共同完成,包括XXXX基本的业务功能,如ZS申请、ZS审核、ZS下载、ZS批量申请等,共完成测试用例138起。根据XXXX需求文档及测试用例严格执行,业务功能基本符合要求后,XXXX公司工程师正式部署上线XXXX系统。

5.1.2协助XXXX机房搬迁

XXXX在7月份进行机房搬迁,XXXX工程师协助XXXX局方完成服务器的搬迁,包括服务器的网络调试、XXXX系统的应用部署等。

5.1.3二线专家支撑

1-8月份二线支撑服务主要包括以下工作:

对XXXX开发人员及测试人员提供专业的知识指导。

制定XXXX系统现网作业方案(版本升级方案、新版本的产品说明;patch 升级方案,打完patch后的产品说明;系统调整方案;相应的升级回退方案)

解答XXXX等局方人员的技术难点。

部分工作明细:

工作类型工作任务工作描述

其他业务OFFLINEXXXX、

OCSP数据库连接

一段时间后超时

分析日志发现oracle连接在建立8小时后会自动断开,故需要使用连

接池来避开这个问题。对OFFLINEXXXX、OCSP与数据库的连接方式进

行改造,改为连接池方式,解决了问题。

远程支持XXXX tomXXXXt启动异常

5.1.4XXXX系统优化

针对XXXX部署上线进行全面测试后出现的BUG进行修复:

5.29-12月份

9-12月份,XXXX平衡运行的同时,成功接入集团采购门户系统与XXXX 基地4A系统,为这两个系统提供最高级别的安全保障。按XXXX公司的要求,XXXX公司配备的4位运维人员,包括两位驻点工程师与两位业务协维工程师,到XXXX基地现场办公,能够及时响应XXXX局方的要求。XXXX公司为XXXX提供全面的运维服务,包括硬件巡检、软件巡检、XXXX系统巡检、业务协维、二线专家支撑等,共计445人天,其中硬件巡检46人天,软件巡检46天,XXXX系统巡检90天,故障处理2天,业务协维174天,二线专家支撑87天,其中10人天为晚上加班。

运维工作量按月分布图

5.2.1系统运维支撑

5.2.1.1系统巡检方式

5.2.1.1.1远程方式

因XXXX系统机房部分办公设备还没准备好,所以只能通过远程连接服务器方式,对各个服务区及服务器进行巡检,巡检内容如下:

5.2.1.1.2现场方式

现场巡检方式是驻点工程师通过到达XXXX机房内部,通过观察各服务器硬件指示灯、风扇运行等,检查服务器系统运行状态,巡检的服务器数量如下:

Unix服务器 6

磁带库服务器 1

交换机17

加密机7

防火墙10

5.2.1.2.1远程方式巡检内容

检查服务器CPU使用情况

检查服务器硬盘使用情况(针对home目录)

检查服务器内存使用情况

检查系统进程运行情况

通过查看日志,检查系统运行情况

5.2.1.2.2现场方式巡检内容

各服务器指示灯

各服务器风扇运行状态

交换机指示灯状态

检查机房实时温度是否达标

检查机房设备温度是否过热

检查机房卫生是否符合要求

有无临时接线搭线未清理

5.2.1.3系统运行分析

5.2.1.3.1系统CPU分析

各服务器CPU运行均都处于正常指标(CPU使用率<=85%)范围内,具体如下:

各服务内存使用正常,没有发生内存占满或内存溢出等故障,保证了各服务进行的运行:

5.2.1.3.3系统硬盘空间分析

各服务器空间以小幅度的速率增长,健康状况良好:

5.2.1.3.4系统进程运行分析

服务器的应用进程处于正常状态,具体如下:

XXXX系统9-12月出现故障情况如下,在故障发生的第一时间,运维人员收到监控系统的邮件通知,并在收到邮件通知的第一时间进行处理,并把故障原因通报XXXX公司相关负责人,在完成后进行记录、整理,输出相应的故障报告等:

渗透测试配合华为对XXXX系统进行入侵检测和渗透测试

软件验收XXXX软件验收KMC、XXXX部分

应急演练配合XXXX局方进行XXXX系统应该演练

5.2.2业务协维

5.2.2.1系统业务管理

创建ZS模板:因项目需求创建项目适用ZS模板,并做好模板备份工作。

创建受理点:为项目创建新受理点,配置人员等。

创建应用类型:为集团采购部项目创建单独应用类型,便于项目ZS量的

统计及数据分析。

操作员权限分配:一方面满足项目需求,另一方面根据安全规范分配。

系统升级上线业务功能测试,保证系统业务功能的可用性与完整性。

XXXX系统内部全面测试:完成内部系统测试,为XXXX系统软件功能验

收测试做好充足准备。

系统监控系统功能部署前测试及功能演示等工作。

参与XXXX系统定制开发需求的评审并提出修改意见,与开发人员配合讨

论确认方案,保障开发前需求评审及方案制定工作顺利完成。

配合南基4A系统接入的联调测试。

5.2.2.2运营支撑内容

受理集团的上线。

等。

平台相关人员对XXXX的问题。

5.2.2.3Z S业务客户服务与支持

受理集团的ZS业务客服咨询与故障投诉申报;ZS业务流程咨询、ZS 使用问题技术支持。

1)指引、FAQ等日常文档输出:

《XXXX业务系统接入指引》

《CMXXXX Open API需求规格说明书》

2)系统业务测试:系统920版本部署前测试,及功能演示,上线后功

能验证等工作。

3)系统业务测试:系统1129版本部署前测试,及功能演示,上线后功

能验证等工作。

5.2.2.4运营数据分析

此图为2011年XXXXZS发放分析

5.2.3专家服务

5.2.3.1运维体系的建立

制定规范制度:规范ZS发行、客户服务等工作流程行为,基于经验、结合CMXXXX的业务特性,制定了CMXXXX数字ZS发行规范、、CMXXXX数字ZS客户服务规范等文档。为建立健全运维、运营体系提供了坚实的基础。

5.2.3.2输出文档

《XXXXCMXXXX应急响应计划

《CMXXXX系统运维规范》

《CMXXXX行规范》

《CMXXXX客户服务规范》

5.2.3.3运维、系统二线支撑

机房网络现场调试

网管监控方案及讨论

定制开发需求评审

部署方案审核

现网作业密码管理

XXXX 明年发展规划

5.2.3.4运营优化

根据项目支撑情况,提出日常运营优化建议:

规范ZS申请流程

规范ZS使用流程

规范UKEY使用流程

5.2.3.5XXXX应用接入

5.2.3.6运维风险评估

渗透测试:为了保障XXXX系统的安全性,应XXXX基地要求,地XXXX 进行渗透测试,从外网到内网全方位、漏洞渗透等,取得了良好的效果。

5.2.4系统定制开发

根据应用项目的特性、运营人员提出的优化需求,进行需求分析、评审,输出解决开发,协调资源进行定制开发工作,把控定制开发质量。1)XXXX支持二级审核开发及上线

改造XXXX,使其支持二级审核。对应用类型配置其下ZS的审核级别。如果是一级审核,。

2)系统监控功能的需求分析及评审

对CMXXXX系统业务进行监控,当系统异常时通过邮件方式通知系统维护人员。系统暂时不考虑对系统权限的管理控制。

3)系统定制开发功能的测试环境搭建。部署XXXX定制开发到测试环境,完成

测试组内测试,进而运营人员针对业务功能进行测试并已完成测试。目前XXXX11月版本已部署上线,验证工作也已基本结束。

6规范运维流程

随着运维工作的逐渐开展,在与XXXX公司的工作配合过程中,通过引入XXXX公司的服务运营管理平台(somp),规范了运维工作流程,包括事件管理流程等。

所谓事件,是指系统运行过程中突然出现的造成服务中断或服务质量下降的突发现象。事件管理流程通过对事件的相关环节进行规范,从事件的记录开始,经过分类和初步支持、调查与诊断、解决和恢复,直到与客户确认后事件的关闭,流程中的各个环节前后相连,流转有序,并规定每一环节处理的最长时限。通过事件记录员、事件分析员以及事件经理等角色的明确,责任到人。从而达到在发生事件后,能在最短的时间内解决并恢复客户中断的服务,提高客户满意度。

XXXX公司通过开发XXXX业务流程监控系统,定时对XXXX业务流程进行监控拨测,在XXXX发生故障第一时间通过邮件或短信的方式通知运维工程师,运维工程师第一时间进行故障处理并上报XXXX相关负责人,并在故障出理完成后,输出故障报告给XXXX公司,使得对每次故障做到跟踪、归纳总结的作用。

7总结与明年展望

随着2011年的脚步慢慢走远,XXXX公司在XXXX公司的大力支持下,XXXX运维工作已经步入正轨,按XXXX公司和XXXX的要求完成了对XXXX 的维护工作,保障了XXXX的平稳运行,通过回顾总结今年的工作,也发现运维工作中存在不足的地方,XXXX公司力争在以后的工作中改进。

2011只是XXXX运维工作的一个起点,2012年随着更多XXXX外部与内部业务系统的接入,XXXX也面临着越来越大的负载,同时运维工作也面临新的挑战,无论是对XXXX系统能力保障、业务人员协维能力,都将给

XXXX公司和XXXX公司提出更高的要求,需要运维人员能力提升到另一个高度,XXXX公司在面对挑战面前,非常有信心,在XXXX公司的指导和支持下,对现有运维人员进行技术能力、业务能力等多方面提高,根据业务发展要求,增加各方面资源投入,明年会更加出色的完成XXXX运维工作,把运维工作更加规范化、专业化,更上新台阶。

推荐访问:信息系统运维工作总结 工作总结 参考 项目

猜你喜欢