网络运维管理制度

时间:2024-08-25 13:32:34 制度 我要投稿

网络运维管理制度

  在现在社会,越来越多人会去使用制度,制度是要求成员共同遵守的规章或准则。什么样的制度才是有效的呢?以下是小编收集整理的网络运维管理制度,仅供参考,希望能够帮助到大家。

网络运维管理制度

网络运维管理制度1

  0.引言

  在当今时代,信息网络系统已成为社会组成必不可少的一部分,而信息网络系统在各个企业中已成为企业办公、生产、运行管理等方面的重要支撑平台,随着社会发展和企业信息化规模扩大,网络的规模也随之越来越大,网络的结构日趋复杂,局域网的运行维护任务也日益显得复杂繁重,因此如何能够简单有效地管理和维护内部网络已成为当前网络管理研究的一个重要方面,迫切需要一种网络管理方式可以简化运维流程、减少运维步骤、快速查找故障、明确运维目标和提高运维效率。目前商用网络管理软件种类繁多,例如国内的北塔、网强等网络管理系统。这些商用软件网络管理功能较为全面,但是针对信息网络运行维护来说,还存在一些不足之处。

  本文介绍了一种针对信息网络运维而设计的网络监控系统,该系统强调以图形化的方式显示当前网络各节点状态。以直观的方式反映网络故障或潜在的故障,具备节点控制、监测日志、统计以及多种智能报警功能,力求减轻网络运维人员的工作量,提高工作效率。

  1.概述

  在大中型企业内部的整个网络上面运行着各种服务器以及众多的个人台式机,点多面广,管理维护难度和工作量都相对较大。仅靠单纯的人工管理,被动式的检查维护已无法满足整个系统良好运转的需要,面对并处理网络中众多设备发出的事件报告和短时间内检测发现故障点等问题,所有的这些要求很清楚地摆在网络管理人员的面前,因此迫切需要对网络进行主动的监视,自动进行网络故障的检测与解决,以维护网络的良好运转,从而更好地服务于整个公司的业务系统。

  图形化监控系统可以更加直接地反映信息网络系统状态和故障,使运维人员明确网络系统运行状态,快速查找故障节点并进行处理。首先,收集网络环境内所有网络节点的信息资料和办公环境图纸,确定网络节点物理位置,建设信息网络节点图形化管理系统,根据收集的信息建立图形界面和联动资料库,包括用户物理位置、用户信息、设备信息、网络连接状态信息等;然后把信息网络节点图形化界面与现有的网络管理系统进行接口配置,在图形界面上产生网络节点的实时状态信息,同时可进行接口状态操作,并进行网络节点状态联动报警系统,当故障发生时,对预先指定的报警情况进行报警,报警方式可通过邮件和短信,使维护人员在第一时间得知并判别故障类型和严重程度,并通过图形界面精确判断故障地点,缩短网络故障发现和处理时间。

  2.图形化网络监控管理系统技术结构、技术优越性

  2.1.图形化网络监控管理系统技术结构

  图形化网络监控管理系统由图形部分、网络管理功能部分、网络健康度评估部分和运维流程部分组成。各部分的作用为:

  2.1.1.图形部分

  图形部分是整个监控管理系统的衔接部分。其作用首先是系统本身各类功能的操作界面和针对网络系统各环节物理位置的直观展示,比如机房内设备位置图、建筑结构图和办公室网络布点图等,以及网络系统整体和部分的拓扑结构图,用三维图形和二维图形结合进行展示;其次是对整个监控管理系统的各功能部分进行衔接,像前面提到的网络管理功能部分、网络健康评估部分和运维流程部分要通过图形部分进行衔接,使各部分功能得到体现,监控人员通过其进行监控和管理。图形部分的完整度和详细度直接影响到整个监控管理系统的运行效果。

  2.1.2.网络管理功能部分

  网络管理功能部分是整个监控管理系统的核心组成,按照分层架构设计思想进行建设,实现网管数据采集与处理的分离,数据处理与呈现的分离,共分为 3 个层次:数据采集层、数据处理层和功能显示层,具有较强的灵活性和可扩展性。

  数据采集层:数据采集层是位于数据处理层与管理对象之间的数据采集子系统,与 IP 网的网元设备和相关的业务系统交互,遵循标准的通信协议,完成系统所需的各类原始管理数据的采集,包括主机、网络、数据库、中间件、应用软件、环境等数据源的原始信息,如配置数据、性能数据、故障数据和准确性数据等。

  数据处理层:将数据采集层所获得各种数据进行清洗、整理和标准化处理,提供各应用功能进行处理分析、统计及存储,如通过触发事件发生器,将收集的各类原始信息与KPI阈值对比后进行分析、配置或处理,形成资源分类的告警信息等。

  功能显示层:针对分类管理信息进行统一汇总和多维展现,实现网络、系统硬件设备资源和软件运行状况的统一监控和管理,保障业务系统的正常运行。

  另外按功能模块划分可分为六大模块,包括数据采集组件、综合网管服务、WEBService 应用组件、IE显示层组件、数据流分析探针、外部数据库,各模块组件之间通过TCP/IP进行通信,支持灵活的集中或多服务器的部署策略,提高系统的可扩展性。下面是其中几种模块的功能简介:

  数据采集组件:接收各网管功能模块的数据采集请求,定时其管理范围内的被管对象中收集IT基础设施信息,同时维护、提供性能数据缓存,存储获得的IT基础设施的性能信息,从而达到:统一的数据获取接口、多管理协议支持、可扩展的IT组件支持、数据有效性控制和智能化网络访问控制。

  综合网管服务:综合网管服务(NMS)作为数据处理层,建立了网络管理模型和资源数据访问模型的标准化,NMS数据处理层中采用了O/R Mapping、IOC、Remoting等技术完成系统的架构和实现。NMS将实体对象的数据如网络配置数据、资源数据存储在关系型数据库中,通过O/R Mapping 实现将关系模型映射到面向对象的数据模型,提供完整的面向对象的数据管理、访问模型和接口,完成了网络管理数据的对象化,包括:网络配置数据、 设备网元数据、性能数据(历史数据、实时数据)、告警规则配置数据、告警信息数据、服务资源数据和用户权限配置数据。

  WebService应用服务:与图形化部分紧密结合,监控系统的应用管理、呈现层采用WEB架构实现,通过WEB2.0、AJAX、WEBSERVICE、JSCRIPT等技术,实现完整的B/S模式的应用管理、数据呈现等核心功能。通过管理控制台集成了网络拓扑管理、网络监控、故障管理、报表管理、服务资源管理、资产管理和系统管理等。方便用户统一执行管理任务。门户功能模块可归纳为三种类型:门户基本框架和管理功能:提供门户通用服务和基本功能。包含用户管理,门户系统权限管理等。对其它系统的集成功能:主要提供对于系统监控管理,流程管理,分析报表集成。管理门户将作为这些系统的统一访问入口,并为用户提供单一登录功能。开发定制的特定服务模块:开发用户要求的日志和审计功能模块,用户访问统计模块。

  数据流分析探针:监控系统的性能数据采集能够支持秒级单位的采样周期。能够提供原始采样频率的数据。监控系统经过一段时间的记录,能够通过对性能数据的对比,生成相应的阀值告警事件。监控系统通过Web访问的方式为用户展示物理拓扑结构,并通过物理拓扑结构为用户提供全网的性能和状态信息,并通过颜色表现表示出来,帮助用户及时发现网络潜在的故障隐患点,从而为用户提供管理数据的分析、诊断机制和运维管理流程。

  2.1.3.网络健康度评估部分

  评价指标主要包括可用带宽、单双向时延、单双向时延抖动和单双向丢包。可用带宽直接影响网络业务的质量、网络对即将开展业务的支撑能力以及网络的扩容规划和设计。单向时延、单向时延抖动和单向丢包之所以不可缺少是由于业务服务器和客户终端内容交互的非对称造成的。评估方式由系统采用基于端到端的网络性能质量测试方法,指标是端到端之间的指标而不是单个设备、某一段甚至某一跳之间链路的指标。端到端的含义包括业务的起始点和业务的终止点整条路径,是业务传输的全部环节,端到端的.单向时延是从一个测量点(一个具体的IP地址)到另外一个测量点的数据报文传递所用的时间,这个时间是转发时延、排队时延和传输时延的总和,通过一系列测试后可以得出现有网络健康度情况。

  2.1.4.运维流程部分

  网络运维流程从功能上可以划分为六个模块,各模块功能如下:

  任务工单管理。该模块实现临时性任务管理功能,如派发给县公司的任务工单、接收来自公司的任务工单、部门内部用于任务分配的个人任务以及部门之间用于项目管理的部门任务等。

  业务流程管理。该模块实现对例行性网络运维业务流程的管理功能,如资源调度流程、故障处理流程、网络优化流程和业务开发流程,这些流程一般可分解为定义良好的任务、角色、规则和过程,通过与人和各种应用系统的交互来进行工作流程的执行和监控,达到提高网络运维效率和网络管理水平的目的。

  统一工作任务列表。该模块为用户提供统一工作任务列表,包括当前任务、新建任务、已派发任务、已处理任务、阅知任务和待发任务。通过统一工作任务列表可以接收处理来自各方面的任务工单及来自工作流系统的业务流程。

  工作任务统计分析。该模块实现对个人工作和组织工作的统计分析功能,包括派发任务数量、接收任务数量、不同难度任务所占比例、任务完成及时率、任务完成质量及绩效指标完成情况等。

  接口适配。该模块提供与网管部分、图形部分以及资源管理平台的接口适配功能,通过系统之间的数据交换和应用集成达到部分业务流程自动化的目标。

  工作流管理系统。工作流管理系统是用于定义、实现和管理工作流运行的一套软件系统,通过与人和各种应用系统的交互来进行业务流程的执行和监控。工作流管理系统是网络运维流程支撑平台的核心,包括图形化建模工具、工作流引擎、管理监控工具和工作任务列表四个主要功能模块。

  2.2.技术优越性

  2.2.1.网络故障查找直观明了,图形化网络监控管理系统的特点是实体图形的大量使用,把网络连接、设备位置、机房或房间布局、故障点描述等通过具体的图形表现出来,再与网络管理系统各个监测功能模块集成,就可以直观明了的对各类故障情况进行图形化描述,信息网络运维人员可通过该系统了解故障的等级、类别、具置,并以此得出相应的处理办法,直接节约了普通故障查找的人力和时间,提高了工作效率。

  2.2.2.网管系统功能全面,由六大模块组成,包括数据采集组件、综合网管服务、WEBService 应用组件、IE显示层组件、数据流分析探针、外部数据库,涵盖层次化管理、拓扑管理、网络监控管理、IP地址管理、主机服务器管理、数据流分析、故障报警管理和报表管理多项功能,还可通过相关功能模块对整体或部分网络系统健康度进行评估,以此为依据指定相应的网络整改方案。

  2.2.3.信息网络运维流程明确,可通过网络运维部分人为或自动进行运维工单下达,实现完备的流程化操作,包括任务工单管理、业务流程管理、统一工作任务列表、工作任务统计分析和工作流管理,从接受运维任务、任务分析、制定运维方式、资源调拨、人员派遣、运维操作、完成任务和对应不同变数选择相应调配方式完成运维流程。

  3.图形化网络监控管理系统的应用

  3.1.系统中图形部分的应用

  该部分应用包括系统本身操作界面图形和具体信息网络拓扑信息及实际物理环境图形的规划编制。

  首先是操作界面图形的规划编制,涵盖层次化管理、拓扑管理、网络监控管理、IP地址管理、主机服务器管理、数据流分析、故障报警管理、报表管理和系统管理,以及各大类下面具体分类的操作界面图形,如下图所示:

  其次是具体信息网络拓扑信息及实际物理环境图形的规划编制,要收集公司范围内所有网络节点的信息资料和办公环境图纸,确定网络节点物理位置,具体到网络设备、网络线缆、网络通道、安全设备、服务器的布点状态,以及信息机房和办公室的布局图纸,如下图所示:

  然后用具体的网络设备图形反应实际网络连接情况,如下图:

  最后可根据图形的详细显示得出网络故障节点位置和严重程度等信息,极大的便利了网络运维工作。

  3.2.系统中网络管理功能部分的应用

  网络管理功能部分是整个监控管理系统的核心组成,通过snmp协议读取和写入交换机、路由器、服务器等信息设备策略和数据信息,主要通过人工录入和自动搜索相结合的手段进行设备发现和链路获取,整合分析数据实现层次化管理、拓扑管理、网络监控管理、IP地址管理、主机服务器管理、数据流分析、故障报警管理和报表管理多项功能,再通过设定网络管理系统本身的报警策略定制报警数值和临界点等信息,以图形颜色标示、声音、短信或邮件等方式对系统管理员进行告警。

  网络管理功能部分是整个系统的核心,图形部分的功能显示、网络整体健康度评价和运行维护人员流程管控,都要通过功能部分进行实现和链接。

  4.结论

  图形化网络监控管理系统在信息网络运维中的应用,将解决网络运维侧重于对网络设备本身或网络的维护与管理的问题,解决各类网管系统之间信息无法互通、管理内容庞杂、操作界面多样等问题带来的局限性,大大降低了信息网络系统的运行风险,提高运维工作效率,实现对全网的综合管理,包括全网故障分析、故障定位、全网性能综合分析等功能,能够从总体上提高企业的全网综合管理水平和运维工作效果。

网络运维管理制度2

  一、统一运维体系的提出

  政务外网是服务于党委、人大、政府、政协、法院和检察院等部门的政务公用网络,逐步覆盖中央、省、地、县四级政务部门,主要满足各级政务部门社会管理、公共服务等方面的需要,为我国各级政务部门的非电子政务业务系统提供承载服务。

  当前,政务外网建设与我国行政体制同构,采用了“分级建设、分级管理”的模式。作为公共网络,政务外网承载的业务应用具有端到端的特点。以某个中央部委发起的纵向业务应用来说,其范围包括中央部委和各省与之对应的厅局,跨越了中央和省两级政务外网。

  对于业务应用来说,它并不关心网络是如何组成的,也不关心两级网络是如何维护的,它关心的是数据通信的高速畅通,故障出现时的快速响应等。换言之,政务外网为业务应用提供的应该是统一的、端到端的服务。

  业务应用的特点决定了政务外网必须要构建统一运维体系,为承载业务提供统一的、端到端的服务,保障业务应用的高效、顺畅和稳定运转。

  二、政务外网的运维服务内容

  “运维”是运行维护的简称,包括运行和维护两方面内容;

  对于运行管理来说,主要是面向网络承载的业务,侧重监视、控制、调度;

  对于维护管理来说,主要是面向网络设备(路由器、交换机、服务器等),侧重软硬件的维护、测试、管理。政务外网必须在面向业务和面向网络两个层面开展各项维护服务工作。

  从工作内容角度衡量,当前政务外网必须开展运行监控、设备维护、配置管理、故障管理、变更管理、资源管理、信息管理、安全管理、业务开通、故障响应等项工作(参见图1),才能保证全网的稳定运行及对已承载的业务提供有力支撑。

  运行监控:包括对链路、设备状态的实时监测,网络流量的实时监控,安全事件的实时监控及面向部委业务应用的实时监控等。

  设备维护:包括设备的定期检测、保养,数据备份,配置检查,主备功能的倒换测试等。

  配置维护:管理网络的配置参数,按要求完成路由、访问控制、策略控制、设备端口等数据的配置、修改和删除。

  故障管理:包括制定故障管理办法,建立故障资料库,故障发生时快速定位故障,调度全网进行解决,控制故障的影响等。

  资源管理:包括资源数据库的建立,定期进行资源数据的整理、核对、统计等,备品备件的使用管理,资源使用的请求响应等。

  安全管理:包括安全策略的制订与变更,安全配置检查,安全事件响应,安全日志的分析、审计,以及定期的安全预警等工作。

  变更管理:指设备、资源、配置的变更管理工作,以及业务的割接管理工作,包括制定变更管理办法、提出变更申请、变更的审核与实施,以及变更的响应等。

  信息管理:通过网络运行情况的统计和分析,为领导、其他相关部门提供准确的网络运行数据。

  故障响应:实时响应客户网络故障申告,全程跟踪、协调处理并反馈信息;对故障处理信息进行统计和分析,向客户提供故障处理报告、网络运行分析报告。

  业务开通:按照相关接口部门(如工程技术部门、客户服务部门等),制定的网络、业务开通方案,完成具体的设备配置、尾纤跳接、开通测试等工作。

  三、统一运维体系的基本框架

  政务外网必须建立统一运维体系,其核心主要体现在上级运维机构对下级运维机构的统一调度上。为了实现统一调度,必须在组织建设、制度规范建设、流程建设和技术支撑平台建设等四个方面,从上到下、从中央到地方实现统一(参见图2)。

  ⒈、统一组织体系

  中央和地方各级政务外网都需要设立相应的运维机构,根据各自的`职责范围,做好本级政务外网的运维保障工作。

  参照电信运营网络在运维管理方面的具体实践,结合政务外网的实际需求,按照管理一条线、维护一条线以及客户故障响应一条线的原则,中央级政务外网运维机构划分为运行管理、运行维护和客户故障响应三部分,它们各司其职,共同完成政务外网的运维工作。

  管理线内,可设置综合管理、技术管理、安全管理、资源管理等职能;维护线内,可设置网络监控、设备维护等岗位,其中设备维护岗位可以按专业进一步划分为网络设备维护、服务器和存储设备维护、应用维护、基础安全维护、CA系统维护等,响应线内设置客户故障响应职能。

  为了实现中央对地方的统一调度,地方运维机构的设置必须和中央保持相对一致。根据中央运维机构的设置要求,地方运维机构需要按照运行管理、运行维护以及客户故障响应三条线来设置相应的职能,以便接口中央的相关调度工作,通过中央与地方的密切配合,共同完成各项维护工作(参见图3)。

  ⒉、统一制度规范

  政务外网内必须建立起一套适用于全网的、规范全网维护工作并要求全网各级运维机构共同遵守的制度规范,从根本上保证维护工作有序、高效开展,提高管理效率,并防患于未然。

  统一的制度规范包括规章制度、技术规范两类。规章制度用于规范全网运维管理工作的职责分工、工作要求等;技术规范用于对设备维护提出操作规范,对网络运行提出质量规范,对运维支撑系统提出功能性规范、接口规范和数据格式规范等。

  通过建立全网统一的制度规范,并在实际工作中严格执行,同时实施监督与考核,才能保证各项维护工作有章可循,全网一致,最终保证全网网络运行稳定、业务服务高效。

  对于中央运维机构制订的各项制度规范,凡是对地方运维工作提出明确要求的,各省级政务外网运维机构都应当严格遵循并贯彻执行(参见图4)。

  ⒊、统一业务流程

  全网范围内必须建立起面向网络维护、面向业务保障的标准工作流程,以流程的方式固化标准工作内容、工作要求和工作范围。

  业务流程既包括运维机构的内部日常工作流程,也包括各级运维机构之间的业务协同流程。对于业务协同流程,要求各级运维机构、人员共同遵守,全网范围内都要做到统一。

  中央和地方的业务协同内容主要包括两个方面:业务开通和故障处理。业务开通主要指中央部委用户利用政务外网开展全国性的业务,需要依托中央骨干网和各省级政务外网,建立联结中央部委和省内有关厅局用户的业务网络。一般来说,此类业务开通协作由工程建设/技术部门牵头,相关部门配合,应视为工程建设任务。因此,和运维相关的协同内容主要指中央和地方在故障处理方面的协同,统一业务流程也主要指的是统一故障处理协同流程。

  中央和地方在故障处理协同方面需要遵循两条原则:首问负责原则和属地受理原则。原则上,用户应当向故障发生地或用户所在地的运维机构申告故障,第一个受理客户故障申告的运维机构或人员,有责任协调故障处理,全程跟踪故障处理的进展状态,并及时向客户反馈。

  在上述原则的基础上,需要从故障受理、判断、处理、测试、反馈5个阶段分别进行协同,配合完成故障处理(参见图5)。流程要点如下:

  ①、地方必须设置服务响应岗位和网络监控岗位,在故障处理协同中,作为中央网络监控和地方网络监控协同的接口;

  ②、在故障受理时,中央和地方均可以受理客户申告,遵循首问负责和属地受理的原则,谁受理谁负责;

  ③、在故障处理过程中,中央指导地方,相互沟通协调并遵循先抢通后修复原则进行故障的处理。

  ⒋、统一运维支撑平台

  运维支撑平台作为政务外网统一运维体系中重要的IT支撑工具,从技术方面减轻了维护人员和管理人员的压力,有力地支撑了政务外网运维工作的顺利开展。通过建立起全网统一的运维支撑平台,以电子化的手段实现全网范围内的统一指挥、统一调度、统一维护,从而实现横纵一体化的运维支撑体系。

  运维支撑平台分为两级三个子系统:中央级运维支撑系统包括监控管理子系统、电子运维子系统和资源管理子系统,与此相对应,省级运维支撑系统也应当包括上述三个子系统,在满足中央统一规范要求的前提下,各省也可以结合自身条件进行扩展(参见图6)。

  ⑴、监控管理子系统

  实现全网拓扑和故障、性能告警的监控,并且将网络运行状态和故障、性能告警信息与业务应用进行有效的关联,重点显示和分析对业务应用的影响范围和影响程度。网络运行监控要实现“下看一级”,即中央监控子系统能够动态监控省级政务外网的运行状态,中央运维人员能够实时发现和中央部委业务运行有关的省网的告警信息。

  ⑵、资源管理子系统

  资源是指需要独立进行分配、维护和监控,且具有配置、性能和故障等信息的物理或逻辑对象。资源管理子系统主要用于管理政务外网的相关资源,提供相关资源的配置信息,掌握各种资源的配备及使用情况,对资源进行统一规范管理,逐步做到对资源的动态管理,发挥资源的最大效益。通过电子化手段,实现政务外网资源数据的规范化管理,实现中央和各省的资源数据动态统一与共享,满足网络运维统一调度管理的要求。

  ⑶、电子运维子系统

  电子运维子系统通过电子化的流程管理和工单管理,实现日常运维工作的流程化、自动化、规范化,保证运维管理的有效性和一致性,从而有效提高生产效率,保留业务痕迹,为业务统计、考核、监督提供基础数据。

  三个子系统在横向和纵向上都通过相应的接口,实现数据交换功能:

  在横向上,监控管理子系统可将告警信息送到电子运维子系统中,形成事件提交运维管理人员处理,通过与资源管理子系统的数据共享,实现告警、性能、拓扑等监控信息与网上承载业务信息的关联。

  在纵向上,中央监控管理子系统与省级监控管理子系统通过告警数据的交换,支撑全程全网的统一监控功能。中央资源管理子系统与各省资源管理子系统能够通过资源数据的交换,实现信息共享。中央电子运维子系统和各省电子运维子系统通过各类工单的传递,支撑并实现“中央-省级”故障处理的业务协同。

  四、结束语

  政务外网作为中国第一个部级政务网络平台,不同于任何一个政务部门的内部专网,具有“公共”的属性,如何管理好这样的公共网络,使其发挥最大效益,是一个非常重要的课题,国内没有先例可循。笔者对构建政务外网统一运维体系所需要考虑的组织体系、制度规范、业务流程、支撑平台等问题进行了初步探讨,以期抛砖引玉。相信随着我国电子政务建设不断深入发展,政务外网作为国家重要的基础网络平台,必将发挥越来越重要的作用。

【网络运维管理制度】相关文章:

网络运维述职报告03-26

网络运维转正申请09-05

运维管理制度07-10

网络运维师岗位职责05-26

网络运维实习生周报02-17

网络安全运维管理制度(通用20篇)03-29

IT运维人员管理制度10-29

安全运维管理制度07-02

网络运维工程师的职责通用03-08