无忧范文网小编为你整理了多篇《IT运维方案(范文五篇)》范文,希望对您的工作学习有帮助,你还可以在无忧范文网网可以找到更多《IT运维方案(范文五篇)》。
第一篇:IT运维现状
伴着IT在企业中的作用日益明显,IT建设和IT运维同时成为了企业效率的加速器。同时,计算机硬件系统和软件系统的运维已成为了各行各业单位,尤其是信息服务部门普遍头痛的事情。本文以下内容总结几个头痛的主要因子,拿出来供大家参考指导,并接下来的系列课题中会对针对这些现状提出改进措施。
现状一:IT运维人员成本偏高
据专业调查,大多数CIO表示最关心的是IT运维成本过高。原因是在过去的5年中,很多企业都实施了很多IT系统,使到IT运行越来越复杂,也越来越难管理。同时,其中有50%的受访CIO认为IT运维成本过高的一个原因是IT运维的自动化做得还不够好,依靠手工流程来管理,不但使到运维效率不高,而且人力成本更是花费惊人。
同时,另一家国际知名调查机构Gartner调查发现,在IT运维成本中,源自技术或产品(包括硬件、软件、网络等)成本其实只占20%,而流程维护成本占40%,运维人员成本占40%。流程维护成本包括日常维护、变更管理、测试成本等;人员成本包括训练、教育、人员流失、招聘成本等。
从图中,我们可以看出, “流程维护”类和“运维人员”两者都与软性方面的成本相关非常紧密。而且三者的关系可以用下图来表示:
备注:C类成本的大小很大程度取决于B和D类。
现状二:处在“救火式”的IT运维控制
目前,国内在IT运维过程中,IT员工大多数只是处在被动低效率手工救火的状态,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”会导致:①.IT运维人员终日忙碌,IT运维人员日常大部分时间和精力是处理一些简单重复的问题;②IT运维本身质量很难提高;③再加上故障预警机制的不完善,往往是故障发生后或报警后才会进行处理,不但事倍功半而且故障还常常会出现恶性连锁反应;④IT部门和业务部门对IT运维的服务满意度都不高。
现状三:简单的自动化程度起了“反作用”
尽管IT运维管理的技术在不断进步,但实际上很多IT运维人员并没有真正解脱出来,主要原因是目前的自动化不高而导致的。目前的技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起更本没法判断问题的根源在哪里。还有,目前许多企业的更新管理绝大多数工作都是手工操作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查操作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化对企业来说已迫在眉睫。
就如图中一样,所有信息(杂乱)都从各个地方被收集到了这个圆圈(容量不变)里面,信息进去后不能主动流出来。可能会出现的情况:这个圆圈容器装满后会爆破,或者是溢出来;圆圈的运行速度会慢慢降下来,从而导致信息输入的速度也会变慢。
现状四:本是同家兄弟,却不经常来往
这个问题主要是发生在拥有许多子公司的企业,每个子公司的系统都是独立的,下面主要以国内银行业为例。以前国内的银行业没有搞集中建设,每家银行的各个地方分行都单独建设和维护自己的核心业务系统,都各自配备开发人员和维护人员。
同时在运行维护方面,对故障的解决,完全依靠运行维护部门的工程师的上门服务。不管问题大小,工程师都要来回去现场解决。遇到一些技术难度大的问题,如果工程师的水平高,处理起来就快;如果水平低,甚至花上几个小时,可能也解决不了。
虽然现在国内银行业的IT运行维护管理水平,有点接近国外80年代末90年代初银行业的水平,现在银行IT结构上都采用了大集中模式。从硬件设备上来看,国内银行不比别人差,甚至还有些领先,但IT运维管理还没达到国外当时的水平,尤其是呼叫中心、客户服务方面。”
结束语
从上面三个现状来看,主要是有关软性方面的。的确如此,国内借着近十几年高速发展,硬件方面的发展取得了重大进步,某些方面的水平甚至是超过了国外的水平,并且IT硬件的生产厂商也是出现了很多与国外厂商同等秀舞的水平,如华为、中兴等。但是往往是硬件易学,知识技巧难寻。这不仅与国内教育环境有关外,还与知识经验的继承又关。
第二篇:IT运维方案
运维服务方案
2017年2月
第1 页
.......................................................................................................................................................... 2 第1章 项目概况 ............................................................................................................................ 3 1.1 项目目标 ............................................................................................................................... 3 1.2 需求分析 ............................................................................................................................... 3 第2章 运维服务管理体系建设 .................................................................................................... 4 2.1 IT服务管理概述 ................................................................................................................... 4 2.2 运维服务管理流程体系 ....................................................................................................... 5 2.2.1 服务支持....................................................................................................................... 6 2.2.2 服务提供....................................................................................................................... 7 2.2.3 服务质量承诺 ............................................................................................................. 11 2.3 服务管理 ............................................................................................................................ 11 2.3.1 服务管理总则 ............................................................................................................. 11 2.3.2 问题管理..................................................................................................................... 12 2.3.3 服务记录管理 ............................................................................................................. 13
第2 页
第1章 项目概况
1.1 项目目标
结合企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。
1.2 需求分析
本次项目需求主要包括两个部分,
1、运维管理体系建设要求;
2、信息系统正常运行保障服务。
其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为企业信息化建设提供决策依据。
信息系统正常运行保障涵盖了
1、一般信息化设备及软件的运维管理;
2、防病毒服务;
3、办公区域内设备及软件巡检普查;
4、提供符合企业实际的服务响应水平及质量保障;
5、信息化资产管理
第3 页
第2章 运维服务管理体系建设
2.1 IT服务管理概述
现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言:
如何把有限的IT资源最有效的作用于核心业务的发展
如何最快地获取专业的支持能力
如何实现对系统的完善管理,提高系统的可靠性和可用性
如何提高用户的工作效率,增加最终用户满意度
如何跟上IT技术的发展,及时更新相关技术
如何提高对IT系统利用的灵活性
如何更好地管理IT运营成本
以提高服务能力,将会是单位可能面临的问题。
IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套指导IT服务的方法论。ITIL是英国国家电脑局(CCTA)于八十年代开发的一套IT业界的服务管理标准库,它把业界在IT管理方面最好的方法归纳起来,形成规范,旨在为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。它一经提出,便被欧洲各大公司纷纷采纳,随后在澳洲,美洲和亚洲流行开来,目前已成为IT服务管理事实上的标准。
第4 页
通过参考这些标准,我们可以充分借鉴国际化标准的IT服务管理最佳经验,使我们“站在巨人的肩膀上”来设计、规划及运维IT服务,尽可能少走弯路,有效提高IT服务的质量。
ITIL框架图
ITIL是基于流程的方法论。IT部门可用其检查是否用一种可控的和可训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织,无论其规模大小,或采取何种技术。
ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析,包括全面的检查清单、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITIL的指导建立和拓展自己的IT服务流程。
2.2 运维服务管理流程体系
运维务管理最核心的是“服务支持”(ServiceSupport)和“服务提供”(ServiceDelivery)两个模块。各流程相互贯穿和作用,形成有机整体,共同建立一个健全的服务管理体系。
第5 页
2.2.1 服务支持
服务支持的内容描述了一个客户如何访问适当的服务,以支持其业务。服务支持包含以下内容:
2.2.1.1 服务台
我们为企业提供统一报障、统一维修、统一的报障电话申请服务。 服务台是服务提供者和用户之间的日常工作的单一联系点。它也是报告突发事件和提交服务请求的焦点。正因为如此,服务台的职责是保持将服务相关信息,行为和契机通知用户,并追踪了解用户每日的行为。例如,服务台可能扮演用户提交变更请求的联系点,基于变更管理流程传达变更实施计划,并保持将变更实施进程通知用户。变更管理应该确保服务台随时保持对变更行为情况的掌握。
2.2.1.2 突发事件管理
突发事件管理流程致力于解决突发事件,并快速恢复服务供应。突发事件被记录下来,并且事件记录的质量决定了相关的其它流程的效力。
突发事件管理的目标:
突发事件管理的目标是尽可能迅速地根据SLA中定义的普通服务级别作出反应,使产生问题后对业务行为及组织和用户的影响最小。突发事件管理也应该保留对事件的有效记录,以便于衡量和改进流程,并向其它流程汇报。
2.2.1.3 问题管理
对于突发事件有两种处理方法,一种是对其做出服务快速响应,尽快恢复其正常运行,另一种是鉴别和解决问题根源。这两种方法之间存在微妙的区别,而且经常被互相混淆。对其做好区分具有重要意义。
如果问题被怀疑存在于IT架构内部,问题管理流程将会瞄准其潜在的根源。
第6 页
一个问题可能是被突发事件暴露出来的,但是显然,问题管理的目标是解决问题根源,预防其可能产生的干扰,而不是迅速恢复系统运行。
当问题被识别后(被识别的问题通常称之为已知错误),通常需要进行一个业务决策,决定是否采取永久性措施改进系统架构,以预防再次发生新的突发事件。如果需要,提交一个变更请求来实现改进。
为了有效和高效地识别突发事件背后的问题根源及其发展趋势,问题管理流程需要准确全面的突发事件的记录。问题管理流程同样需要和可用性管理流程密切联络,以确定这些趋势并明确补救措施的重要性。
2.2.2 服务提供
服务提供主要包括:服务级别管理、能力管理、持续持续管理、可用性管理等。
2.2.2.1 服务级别管理
服务级别管理的目标是缕清与客户之间有关IT服务的协议,并付诸实施。 因此, 服务级别管理需要收集客户需求, IT服务组织可提供的设施,以及可用的财务资源。 服务级别管理针对提供给客户的服务 (聚焦客户的)。因此是基于客户需求建立服务 (需求拉动),而非单纯基于现有技术所及(供应驱动),从而使IT服务组织提高客户满意度。服务级别管理阐述的内容有:
如何在服务级别协议(Service Level Agreement – SLA)中清楚地定义条款, 使其可优化IT服务成本, 并为用户所接受。 如何监控和讨论所提供的服务。
如何管理IT服务组织的供应商及其下包合同。
服务级别管理(Service Level Management -SLM)流程是用来确保服务级别协议,并支持运行级别协议及其它合同,保证所有对服务质量的影响减少
第7 页
到最小。此流程在服务质量和SLA基础上评估各种变更造成的影响,包含预期变更前的影响, 也包含评估实施变更后的影响。SLA中某些最重要的目标和服务可用性、以及在容许周期内对突发事件形成决策有关。
SLM是服务支持和服务交付的关键。由于它依赖于其它流程的存在性, 有效性及运行效率, 它不可孤立存在。一个缺乏基础支持流程的SLA是没有意义的, 缺乏支持的SLA就失去了承认其内容的基础。
2.2.2.2 一般设备软件安装及维护
此部分主要解决在用户使用当中遇到的软件各种问题,在进行软件维护时应做好用户数据的备份,建立软件维护流程,通过现场解决及用户培训的多种方式提高用户的使用水平和解决一般问题的能力。
软件维护主要内容包括:
对WINDOWS操作系统的安装、调试及升级;
外设(打印机、扫描仪等设备)的相关驱动程序及软件的安装调试; 经越秀工商授权进行软件安装、升级并排除软件使用过程中的故障; 解决软件冲突造成的系统故障;
对计算机进行病毒检测和清除,防止病毒扩散;
计算机标配的软件备份,包括随机恢复光盘,附带赠送软件、驱动程序等;
计算机外设的软件备份。
2.2.2.3 一般设备硬件日常保养及维修
计算机硬件维护:包括主机、硬盘、驱动器、显示适配卡及服务器等安装、调试和配置,充分利用现有设备,进行系统优化配置;对使用中的计算机存在或将要出现的故障进行及时的诊断、维修、替换,对客户原厂保修的机器(如计算
第8 页
机及配件、服务器等),我们代为联络维修,并跟踪维修情况。并根据越秀工商需要,对设备进行升级或更新,保证设备正常运行。
周边设备的维护:包括打印机、扫描仪、显示器等使用过程中出现的故障或不稳定因素排除,必要时对越秀工商原厂保修期内的机器,我们代为联络维修,跟踪维修情况,并根据客户需要,对设备进行升级或更新,保证工作任务的正常进行;
系统硬件设备(计算机、服务器,路由器,交换机、备份设备、MODEM等)、计算机线路连接、各种设备工作状态例行检查和维护; 操作项目
维护工程师每月的对企业计算机设备的巡检服务,了解和记录最新的使用情况,对各终端在用办公软件予以普查并核对运维软件资产记录,通过月服务报告上报企业普查情况;对经常出现问题的设备进行登记和记录,并且制定知识库,对常出现的设备要重点检查、消除隐患,最大限度降低计算机设备的故障率。
维护工程师在对用户维护的时候,必须按照服务流程来进行,给用户提供快速、标准、满意的服务。对保内的计算机硬件进行免费的更换,时间方面按照原厂商的服务标准时间来进行。对保外的设备,维修费情况按照合同约定执行。
对经过维修或已更换配件的设备,根据具体情况延长保修期并更新资产库记录,更新配置库记录。
对终端用户的输入设备以及公用设备予以定期消毒处理。
第9 页
运维服务商每月进行一次巡检运维工程师制定《巡检工作计划》,说明采巡检时间安排、巡检内容、巡检地点、资源配合等是否通过服务主管、运维部、信息中心审批?是否运维工程师按照《巡检工作计划》执行巡检工作,并将巡检过程和结果记录在《巡检记录表》中运维工程师在完成巡检工作后,对巡检结果进行评估,并提出意见和建议,形成《巡检报告》是否通过服务主管、运维部、信息中心审批?是巡检过程中是否发现问题?否是否转【问题管理】流程中系统存在问题流程处理巡检过程是否有不符合的配置项?否结束是转【配置管理】流程处理图4-3 例行维护流程图
一般信息化设备硬件服务还包括:
供应商根据实际需要,经企业同意准备相应数量的维护零配件,协助越秀工商进行备件库的管理,并在零配件不足时及时补仓。 定期对计算机设备进行保养维护,定期进行用户满意度调查; 对一般信息化设备硬件进行定期巡检、保养,以保障设备运行正常; 进行硬件设备普查工作,建设可实现动态维护的硬件设备档案库 定期对公用信息化设备消毒除尘;
第10 页
检查硬件实际配置与设备登记表是否相符。 对故障设备的维修
在响应时间内完成故障设备的维修,维修人员应严格遵守维修规程。 建立硬件应急维修小组,对关键重点岗位及紧急的故障及时响应并及时汇报,对于故障设备的维修由越秀工商指定的具体技术人员组织监督进行;
对处于保修期内的故障设备,供应商在广州市工商局越秀分局授权的范围内代表越秀工商协调产品供货商予以维修,并监督维修时效和质量;
对处于保修期外的故障设备维修,如需更换零配件,可由供应商提供多家的报价,经用户选择审核确认后,方可进行更换;
2.2.2.4 客户端病毒处理
对存在病毒的终端予以隔离,生成事件安排工程师予以处理。
2.2.3 服务质量承诺
a、工作时间承诺:每周一至周五(不含节假日),按照采购人工作时间提供服务,投标人在接到采购人服务申请后 1小时 内响应采购人。如采购人需要投标人在节假日期间提供服务,投标人会全力支持,如需要,可到现场支持。
b、响应方式承诺:热线电话、远程桌面支持,驻场解决。
c、服务类型承诺:送修、现场、特殊服务要求(如购件、升级等)。 d、保密要求承诺:详见保密协议。
2.3 服务管理 2.3.1 服务管理总则
服务工程师将认真学习和遵守采购人所有有关外来人员管理的规章制度,且
第11 页
有义务不对外透露在采购人获得的一切信息。
项目组成员在采购人的一切工作都在得到信息中心管理人员的授权之后进行。
项目组成员一旦发生政治事件、泄密、盗用用户资料、擅自更资料、故意隐瞒、超越授权操作导致恶性事件或给采购人带来影响重大的事件等事件,即视为安全事故。
全面配合采购人积极参与对其派驻工程师的有效的监督和管理,遵守采购人的相关规章制度。
坚决杜绝因项目组成员发生的安全问题。
保证其项目组成员符合一定的技术水平,采购人有权对不满足工作要求的越维科技项目组成员向越维科技提出更换的要求;工作中坚决杜绝弄虚作假的现象出现。
未经采购人同意,不将所接触到的采购人技术或业务资料、数据用作其他用途或以任何形式泄露归第三方。
2.3.2 问题管理
1、常见问题管理服务
根据多年的服务数据分析,我们发现,在日常运行服务项目中,70%的问题,都是曾经出现过的,如果能够对服务进程中遇到的所有问题及解决办法都作好详尽的记录,并将此作为服务项目组培训的素材,讲大大的缩短故障处理时间,降低服务成本。
针对采购人IT设备经常出现的故障,或采购人在计算机应用中经常遇到的问题,由项目负责人和技术骨干进行该类问题的技术研究并提供解决办法和防范建议的服务。
2、提升问题管理服务
对采购人IT设备出现的未知解决方案的故障,或采购人用户在计算机应用中遇到的未知解决办法的问题,越维科技提供相关资深工程师和项目主管一起进行该类问题的技术研究并提供应急性质的解决办法和相应的防范建议。
第12 页
2.3.3 服务记录管理
我司使用服务单作为服务记录,记录分别由服务受理人员、服务工程师以及被服务的客户三方完成,并且由客服中心服务台统一进行定期回访,每季度根据服务单统计服务信息并形成服务报告提交给采购人。
第13 页
第三篇:IT运维驾驶舱
IT运维驾驶舱
随着智能电网的建设,IT信息系统已广泛应用于网、省、市、县、站所等各级电力单位,深入应用于发输变配用等核心业务和财务、物资、人力资源、办公等辅助业务中,涵盖了生产、管理、营销、财务、安监等所有部门,信息自动化系统在生产、运营、管理的各个环节中发挥着重要的作用。要保证智能化信息系统的安全可靠运行,IT运维管理的重要性变得日益突出,如何对自动化系统资源进行有序的运维管理,建立能够满足智能化电网需求的IT运维体系,确保系统安全、稳定、高效的运行,成为各级电力信息管理部门高度重视的问题。
目前,国内电力企业的 IT 运维管理存在着以应用为导向、被动的管理、业务区域分散等问题,无法满足电网企业日益增长的多业务变革、智能化个性化服务的需求。因此,IT运维必须从“以应用为中心”向“以服务为中心”转变,从“隔离分散状态”向“集中协同方向”发展,从“被动运维”向“主动服务”转变,服务创新与技术创新并重。基于此,笔者提出IT运维驾驶舱(IT Operation and Maintenance Cockpit,ITOMC)系统。这种系统是基于统一的IT运维基础数据平台,通过对KPI指标的智能分析,采用服务方式提供关键异常事件的预警和智能决策支持,完全满足智能电网对IT运维系统保驾护航的需求。
变革带来新要求
四大业务变革
智能电网中企业与用户的交互更直接和频繁,设备的运行与管理进行远程监控,电能由集中和分布式电网提供,双向电网潮流的控制,供电故障能实现自愈,智能电网的这些特点要求传统电网企业必须革新业务。
实现大数据采集与处理,注重系统分析决策能力,完成智能化电网调度,同时要求资源最优化配置能力;
能够对电网进行模拟仿真分析,实时风险预警和异常处理,快速的故障隔离与恢复,实现坚强智能电网自愈功能;
在安全稳定的基础上,实现生产、管理、经营业务的创新融合和需求侧与生产侧的业务互动,保持节能与市场效益的最大化;
注重物联网、云计算等新技术在智能电网中的应用。
智能电网业务变革推动信息化的发展,同时信息化也是业务变革的不可或缺的重要内容和手段,新技术的应用和新业务的建设导致系统更加复杂化和多样化,系统覆盖范围扩大化,IT运维管理的难度显著增加;生产管理系统与实时监控系统的联系更加紧密,IT信息系统安全要求更加突出。
四项IT运维挑战
智能电网下,业务的变革给IT 运维管理带来四个方面的挑战。
IT系统建设:智能电网中新技术应用层出不穷,但与之相匹配的规划、建设、测试标准并未成熟,在系统建设过程中容易造成需求分析不充分,需求控制力度不够,开发质量监管力度不足,评测手段缺乏、测试力度不够等问题;
IT运维模式:智能电网中信息系统间的联系越来越紧密,电网企业信息系统群逐步朝着一体化集中的方向发展,信息链越来越长,问题追踪越来越复杂,传统的分散IT运维管理方式无法承担新的运维工作,要求必须改变IT运维结构以满足新的大集成需求,分散或半集中的运维模式需要向集中运维模式发展;
IT运维流程:智能电网中IT系统以服务最终用户为核心,而传统的IT运维管理以服务企业内人员、保证企业内业务稳定顺行为核心,IT运维服务对象的改变将导致IT运维流程发生新的变化,运维流程将会向多层次用户延伸,原有制度流程将不能满足新形势下的运维工作需要;
IT系统安全:智能电网中云计算、物联网、移动互联网等新技术的应用,扩大了电网企业信息系统的范围,增加信息系统出口,对IT安全提出了更高的要求。坚强是智能电网的基础,坚强不仅要求骨干网架的安全稳定、抗攻击性强,对智能电网运行所依赖的整个信息环境的安全也同样有严格的要求,建立一套覆盖物理层到应用层的纵深信息安全防御体系是对坚强智能电网的基础支撑。
“一站式”IT运维系统
认知ITOMC
针对传统的IT运维系统建设中存在的侧重应用忽略服务、资源分散管理、被动式运维等问题,同时根据智能电网下电力企业业务的变革和IT运维管理面临的挑战,笔者提出“IT运维驾驶舱”(ITOMC)的概念。IT运维驾驶舱系统基于统一的IT运维基础数据平台,通过详尽的、个性化的关键指标体系(KPI),实时反映所辖系统的业务运行状态、IT设备运行状态、运行环境状态,将各类监视分析对象的信息形象化、直观化、具体化,提供关键异常事件的预警和智能决策支持,采用信息综合挖掘技术深入分析IT系统运行特征,实现运维系统运行态势快速、有效的感知,为运维人员、高级管理者、运营系统管理者、高端决策者等相关人员提供监视、分析、查询和操作“一站式”服务平台,向他们传递IT系统的整体运行状况、提供基于IT服务的决策依据,高度满足“集中管理、智能分析、辅助决策”的需求。
基于以上对ITOMC概念的描述,它的体系结构应该是:ITOMC对企业内各级IT基础设施产生的数据进行数据采集、数据集中、数据整合;在完成IT系统平台设施全面管理和业务应用管理的基础上,借助于支撑服务和应用服务实现对IT系统的智能监控和风险预警,并使用驱动引擎技术进行深层次的数据挖掘,对数据进行系统分析和评价,为企业各级用户提供基于IT运营的决策支持。
功能描述
根据ITOMC系统体系结构,系统可分为数据中心、驱动引擎、基础应用服务、辅助分析、可视化展现五大部分。
数据中心:进行全局系统运维数据的集中存储,负责数据采集、数据存储及大数据的处理、第三方应用系统的无缝集成,建立统一的IT运维数据中心,为上层业务应用提供基础数据和深度数据支持;
驱动引擎:作为驾驶舱核心支撑技术的封装,实现了将消息交互、数据挖掘、任务驱动、工作流、SOA服务等运维业务应用,业务决策从应用程序代码及部署中分离出来,降低实现复杂业务逻辑的组件的复杂性,增强应用程序的可维护性和可扩展性,为上层应用和服务提供技术动力;
基础应用服务:主要包含系统信息管理等支撑应用、系统安全运行等公共服务两大部分,为驾驶舱系统运行提供资源管控、安全防护等基础功能;
辅助分析:基于数据中心平台和驱动引擎,采用运行状态感知、智能故障诊断、智能风险评估、辅助决策、智能任务流程、信息推送、智能控制等技术,实现对系统实时/非实时数据、辅助应用信息、第三方集成系统、各类告警及事故信息等进行综合分析处理,根据系统和设备对IT系统运行的影响程度、KPI指标和专家知识库,综合评价系统的运行状况,为IT系统运行、维护、管理提供可视化的智能分析诊断、导航决策;
可视化展现:基于驾驶舱视图引擎,运用WPF和Flex 技术采用二维、三维的方式展示全局所有IT 运维数据,使用户体验到应用软件特殊的视觉冲击,监控界面能够更加直观、友好的反应当前系统和设备的运行状态,并可按照业务和应用的具体需求,可灵活设计、组态、构建面向不同业务、不同身份的运维驾驶舱,如可分别为运行人员、管理人员、单位领导等设计驾驶舱。
关键技术
在IT运维驾驶舱系统研究、建设的过程中,必须重点关注以下六方面的技术问题。
满足IT全业务系统数据集成的系统建模技术。IT运维驾驶舱系统数据集成技术对网络设备、服务器、中间件及环境等IT系统全部业务的数据统一接入、统一处理、统一存储,建立多专业系统信息资源、应用资源统一的编码和规范,形成合理的统一的数据模型是实现驾驶舱系统智能数据中心的基础。
数据采集和大数据处理技术。驾驶舱系统需要对全域内所有IT系统进行运维监视,不仅需要采集和处理大量数据,而且当系统内部分设备和应用处于电网安全I、II区内时,还需要进行跨安全区数据交互的无缝实时集成,大数据的采集和处理是实现驾驶舱成败的关键。
开放安全的服务架构。建设贯穿全域的运行服务总线,实现现有技术功能的模块化建设,支持未来功能的灵活扩展,在保证系统安全的基础上,实现运维信息的全流通、功能的即插即用、所有资源的统一管控,这是构建驾驶舱的技术前提。
多维度KPI指标体系的建立。驾驶舱系统实现运维全业务系统数据的集成,传统的单维度指标需要向多维度转变,建立能够评价系统服务水平、IT 运维质量、全域资源分配和规划状况、全域 IT 运维整体综合情况等KPI指标体系是实现高级辅助分析和安全预警的基础。
多维度信息下的辅助分析技术。驾驶舱高级辅助分析横跨不同的数据源,需要对全域海量数据进行多维关联、汇总挖掘、高效运算,使系统管理者快速掌握全网IT运维体系的各类分析结果,提供准确快速直观的辅助决策。同时,这也是驾驶舱系统集中运行管理和决策支持平台建设的意义。
纵横向系统全面共享的数据交互技术。纵向系统的数据交互实现下级与上级运维驾驶舱系统业务和信息的“纵向贯通”,使上级总域与下级子域运维驾驶舱实现一体化集成,提高系统的应用水平和运行可靠性,提升整个区域运维的管理水平,实现运行集约化、应用分布化、管理扁平化;横向系统的数据交互实现与其它电网核心业务系统的互联,使运维驾驶舱作为区域电网运行安全的重要参考指标。
第四篇:IT运维
IT运维IT 运维管理
所谓 IT 运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 运行环境(如硬软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理. IT 运维管理主要包括七个方面的管理内容:
·设备管理:对网络设备、服务器设备、操作系统运行状况进行监控和管理;
·应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服 务的监控管理,如邮件系统、DNS、Web 等的监控与管理;
·数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;
·业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理, 主要关注该业务系统的 CSF(关键成功因素 Critical Success Factors)和KPI(关键绩效指 标Key Performance Indicators);
·目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;
·资源资产管理:管理企业中各 IT 系统的资源资产情况,这些资源资产可以是物理存在 的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;
·信息安全管理:目前信息安全管理主要依据的国际标准是 ISO17799,该标准涵盖了信 息安全管理的十大控制方面,36 个控制目标和 127 种控制方式,如企业安全组织方式、资产 分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;·日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩 效考核量化依据、提供解决经验与知识的积累与共享手段.
第五篇:IT运维配置管理方案书
IT运维配置管理系统项目
建议书
北京中辰华创科技有限公司
2014年7月
目 录
一、IT运维配置管理背景 .............................................................................................................. 3
二、IT运维配置管理现状 .............................................................................................................. 4
三、解决方案 ................................................................................................................................... 8
四、IT运维配置管理应用效果 .................................................................................................... 10
4.1实现集中帐号管理,降低管理费用 .............................................................................. 10 4.2实现集中身份认证和访问控制,避免冒名访问,提高访问安全性 .......................... 10 4.3实现集中授权管理,简化授权流程,减轻管理压力 .................................................. 11 4.4实现单点登录,规范操作过程,简化操作流程 .......................................................... 11 4.5实现实名运维审计,满足安全规范要求 ...................................................................... 12
五、总结......................................................................................................................................... 12
一、IT运维配置管理背景
随着各行业业务的迅速发展,各种经营支撑系统不断增加,网络规模迅速扩大,支撑系统中有大量的网络设备、主机和数据库等IT系统,它们分别属于不同的部门和不同的业务系统。目前各IT系统都有一套独立的用户管理、认证、授权和审计机制,由相应的管理员负责维护和管理。当维护人员同时对多个系统进行维护时,设备的权限管理复杂度会成倍增加,经常出现共享帐号,弱口令帐号,授权不清,访问控制不严,操作审计不全等问题,降低了核心设备和关键设备的安全性,给单位或组织的生产和运营带来巨大风险。
原有的由各个系统分散的进行用户、认证、权限、审计的管理模式造成了在业务管理和安全之间的失衡,已经成为业务发展的瓶颈之一,不能满足单位目前及未来业务发展的要求。
IT运维配置管理系统针对单位内部的网络设备和服务器进行保护,对此类资产的常用访问方式进行监控和审计。例如对字符终端、图形终端等访问方式进行监控和审计,实现对用户运维过程的标准化管理,满足单位内部网络对核心资源的访问安全的要求。
二、IT运维配置管理现状
目前,单位或机构的运维管理有以下三个特点:
关键的核心业务都部署于Unix和Windows服务器上。 应用的复杂度决定了多种角色交叉管理。
运行维护人员更多的依赖Telnet、SSH、FTP、RDP等进行远程管理。 基于这些现状,在管理中存在以下突出问题:
1. 使用共享帐号的安全隐患:单位的支撑系统中有大量的网络设备、主机系统和应用系统,分别属于不同的部门和不同的业务系统。各应用系统都有一套独立的帐号体系,用户为了方便登陆,经常出现多人共用帐号的情况。多人同时使用一个系统帐号在带来方便性的同时,导致用户身份唯一性无法确定。如果其中任何一个人离职或者将帐号告诉其他无关人员,会使这个帐号的安全无法保证。由于共享帐号是多人共同使用,发生问题后,无法准确定位恶意操作或误操作的责任人。更改密码需要通知到每一个需要使用此帐号的人员,带来了密码管理的复杂化。
2. 密码策略无法有效执行:为了保证密码的安全性,安全管理员制定了严格的密码策略,比如密码要定期修改,密码要保证足够的长度和复杂度等,但是由于管理的机器数量和帐号数量太多,往往导致密码策略的实施流于形式。 3. 授权不清晰:各系统分别管理所属的系统资源,为本系统的用户分配权限,无法严格按照最小权限原则分配权限。另外,随着用户数量的增加,权限管理任务越来越重,当维护人员同时对多个系统进行维护时,工作复杂度会成倍增加,安全性无法得到充分保证。 4. 访问控制策略不严格:目前的管理中,没有一个清晰的访问控制列表,无法一目了然的看到什么用户能够以何种身份访问哪些关键设备,同时缺少有效的技术手段来保证访问控制策略被有效执行。
5. 用户操作无法有效审计:各系统独立运行、维护和管理,所以各系统的审计也是相互独立的。每个网络设备,每个主机系统分别进行审计,安全事故发生后需要排查各系统的日志,但是往往日志找到了,也不能最终定位到行为人。
另外各系统的日志记录能力各不相同,例如对于Unix系统来说,日志记录就存在以下问题:
Unix 系统中,用户在服务器上的操作有一个历史命令记录的文件,但是用户可以随意更改和删除自己的记录;
root 用户不仅仅可以修改自己的历史记录,还可以修改他人的历史记录,系统本身的的历史记录文件已经变的不可信; 记录的命令数量有限制;
无法记录操作人员、操作时间、操作结果等。
对运维的管理现状进行分析,造成这种不安全现状的原因是多方面的,总结起来主要有以下几点。
1. 各IT系统独立的帐户管理体系造成身份管理的换乱,而身份的唯一性又恰恰是认证、授权、审计的依据和前提,因此身份的混乱实际上造成设备访问的混乱。 2. 各IT系统独立管理,风险分散在各系统中,各个击破困难大,这种管理方式造成业务管理和安全之间失衡。 3. 核心服务器或设备的物理安全和临机访问安全通过门禁系统和录像系统得以较好的解决,但是对他们的网络访问缺少控制或欠缺控制力度。 4. 在帐号、密码、认证、授权、审计等各方面缺乏有效的集中管理技术手段。
三、解决方案
针对以上问题,以解决主要问题为方向,单位迫切需要建立起一套合规、稳定、高效的基础平台系统,IT运维配置管理系统。将分散自治式的管理模式改为集中的管理模式。只有集中才能够实现统一管理,也只有集中才能把复杂问题简单化,集中管理是运维管理思想发展的必然趋势。IT运维配置管理系统为资源提供统一的单点登录访问入口,在平台上集中进行帐号管理、授权管理、认证管理,并通过协议代理技术实现资源运维过程的审计。通过IT运维配置管理系统的建设,达到以下效果:
1.为用户提供统一的操作和维护的入口和平台。为集中管理各个主机、网络设备、数据库提供了技术手段,可以集中管理、登陆各个IT系统,包括各种主机、网络设备、数据库及应用,在未来增加新业务系统时也能迅速、方便的通过该系统进行发布。用户访问IT运维配置管理系统时,系统为每个用户提供自己的操作平台,登录后显示所有授权给自己的IT系统,通过点击访问方式单点登录到各IT系统完成访问动作。
2.实现集中的账号管理。管理员在一点上即可对不同系统中的账号进行管理,由系统自动同步不同系统下的账号;账号创建、分配过程均留下电子记录,便于审计。
3. 实现集中的身份认证。管理员不仅可以根据需要选择不同的身份认证方式,而且在不更改或只对应用进行有限更改的情况下,即可在原来只有弱身份认证手段的IT系统上,增加强身份认证手段,提高系统安全性。通过一次登录可以访问包括WEB和非WEB在内的所有授权的IT系统,可以使用户无需记忆多种登录过程,用户ID和口令。它通过向客户提供对其个性化资源的快捷访问提高生产效率和利润、降低管理开销、提高整个系统的安全性。
4. 实现集中访问授权。对单位资产进行有效保护,防止私自授权或权限未及时收回对单位信息资产造成的安全损害;实现基于角色的授权管理,在人员离职、岗位变动时,只需要在一处进行更改,即可在所有纳入IT运维配置管理管理平台的系统中改变权限;可以为授权增加特定的限制,如只有在规定的时间段、来自特定地域的人员才能访问指定的资源。
5. 实现集中安全审计管理。不仅能够对人员的登录过程、登录后进行的操作进行审计,而且能够将多个主机、设备、应用日志进行对比分析,从中发现问题。
6. 实现细粒度的访问控制。通过IT运维配置管理实现内部网络运维行为管理,最大限度保护用户资源的安全。细粒度访问控制体现在命令策略,时间策略和地址策略上,命令策略是命令的集合,可以是一组可执行命令,也可以是一组非可执行的命令。
四、IT运维配置管理应用效果
4.1实现集中帐号管理,降低管理费用
实现对用户帐号的统一管理和维护:集中帐号管理可实现对IT系统所需的帐号基础信息(包括用户身份信息、机构部门信息、其他公司相关信息,以及生命周期信息等)进行标准化的管理,能够为各IT系统提供基础的用户信息源。通过统一用户信息维护入口,保证各系统的用户帐号信息的唯一性和同步更新。
解决用户帐号共享问题:主机、数据库、网络设备中存在大量的共享帐号,当发生安全事故时,难于确定帐号的实际使用者,通过部署IT运维配置管理系统,可以解决共享帐号问题。
解决帐号锁定问题:用户登录失败五次,应对帐号进行锁定。网络设备、主机、应用系统等大都不支持帐号锁定功能。通过部署IT运维配置管理系统,可以实现用户帐号锁定、一键删除等功能。
4.2实现集中身份认证和访问控制,避免冒名访问,提高访问安全性
提供集中身份认证服务:实现用户访问IT系统的认证入口集中化和统一化,并实现高强度的认证方式,使整个IT系统的登录和认证行为可控制及可管理,从而提升业务连续性和系统安全性。
实现用户密码管理,满足SOX法案内控管理的要求:IT运维配置管理系统通过建设集中的认证系统,并结合集中帐号管理的相关功能,实现用户密码管理,密码自动变更,提高系统认证的安全性。
实现对用户的统一接入访问控制功能:部署IT运维配置管理系统前,维护人员接入IT系统进行维护操作具有接入方式多样、接入点分散的特点。而维护人员中很多是代维人员,这些代维人员来自于各集成商或设备供应商,人员参差不齐,流动性大。由于维护人员对系统拥有过大权限,缺乏对其进行访问控制和行为审计的手段,存在极大的安全隐患。IT运维配置管理系统统一维护人员访问系统和设备的入口,提供访问控制功能,有效的解决运维人员的操作问题,降低相关IT系统的安全风险。
4.3实现集中授权管理,简化授权流程,减轻管理压力
实现统一的授权管理:各应用系统分别管理所属的资源,并为本系统的用户分配权限,IT运维配置管理系统实现统一的授权管理,对所有被管应用系统的授权信息进行标准化的管理,减轻管理员的管理工作,提升系统安全性。
授权流程化管理:通过IT运维配置管理系统,管理层可容易地对用户权限进行审查,并确保用户的权限中不能有不兼容职责,用户只能拥有与身份相符的权限,授权也有相应的工作流审批。
4.4实现单点登录,规范操作过程,简化操作流程
单点登录:用户通过一次登录系统后,无需认证的访问包括被授权的多种基于B/S和C/S的应用系统。单点登录为具有多帐号的用户提供了方便快捷的访问途经,使用户无需记忆多种登录用户ID和口令。它通过向用户和客户提供对其个性化资源的快捷访问来提高生产效率。同时,单点登录可以实现与用户授权管理的无缝连接,这样可以通过对用户、角色、行为和资源的授权,增加对资源的保护,和对用户行为的监控及审计。
规范操作流程:规范操作人员和第三方代维厂商的操作行为。所有系统管理人员,第三方系统维护人员,都必须通过IT运维配置管理系统来实施网络管理和服务器维护。对所有操作行为做到可控制、可审计、可追踪。审计人员定期对维护人员的操作进行审计,以提高维护人员的操作规范性。
4.5实现实名运维审计,满足安全规范要求
实现集中的日志审计功能:各应用系统相互独立的日志审计,无法进行综合日志分析,很难通过日志审计发现异常或违规行为。IT运维配置管理系统提供集中的日志审计,能关联用户的操作行为,对非法登录和非法操作快速发现、分析、定位和响应,为安全审计和追踪提供依据。 辅助审查:通过集中的日志审计,可以收集用户访问网络设备、主机、数据库的操作日志记录,并对日志记录需要定期进行审查,满足内部控制规范中关于日志审计的需求,真正实现关联到自然人的日志审计。
五、总结
单位内部网络安全存在诸多的问题,每种问题都不可小视,对于这些问题,单位内部应该规范管理,应该使用更为先进的IT技术手段、技术工具来帮助管理员进行规范化管理,这样才能够保证单位内部网络的安全性。IT运维配置管理系统使得单位内部网络的管理合理化、安全化、专业化和规范化,充分保障单位网络资源和信息资源的安全。
北京中辰华创科技有限公司成立于2010年,注册资金500万元,公司办公地点位于中关村南大街甲2号数码银座A座,主要从事IT系统运维管理技术与产品开发、信息安全技术研究与产品开发、信息系统安全工程建设与安全管理服务等安全业务。
公司核心成员均为业界资深人士,公司现有各类技术人员100余名,80%具有本科以上学位,其中博士2名、硕士1名,管理和研发骨干均具有丰富的从业经验,具备较强的科研、创新能力。
自2010年以来,相继推出了一系列的产品:IT运维管理系统、业务运维监控系统、信息安全实训与攻防演练平台、互联网流量缓存加速系统。在IT运维管理领域、信息安全攻防模拟以及网络应用优化领域获得技术的提升。
联系我们:010-56248750 18611034978 MAIL:zchcsupport@126.com