网络监测及运维管理系统

一、背景
随着网络规模的膨胀和复杂度的增加,网络管理在今天的网络环境中起着愈发重要的作用。目前还没有对网络管理的精确定义。例如,对公用交换网,网络管理通常指实时网络监控,以便在不利的条件下(如过载、故障)使网络的性能仍能达到最佳。又如,狭义的网络管理仅仅指网络的通信量管理,而广义的网络管理指网络的系统管理。网络管理功能可概括为OAM﹠P,即网络的运行(Operation)、处理(Administration)、维护(Maintenance)、服务提供(Provisioning)、网络拓扑结构发现等所需要的各种活动。有时也考虑前三种,即把网络管理功能归结为OAM。

二、目的
1、主要考虑网络的监控管理系统的建设,建成后的网络运行保障管理系统应达到以下建设目标:
(一)强化主动监控,实现集中管理。部署集中监控系统,实现网结、业务资源、业务应用的全面集中监控,构建统一集成的系统资源监控平台,及时地发现问题,解决被动服务的局面。
(二)快速定位故障,减少维护成本。建立集中的告警分析处理机制和故障预警机制,提供自动化的事件处理能力,当故障产生时,可以快速定位故障,很快发现问题根源并找到相应的解决方案,从而缩短故障解决时间,减少维护成本。
 (三)掌握运行效率,合理利用资源。建立服务管理平台后,可以实时了解全部IT资源的使用情况,根据需要从整体角度考虑资源的使用,甚至可以根据业务高峰期的不同来调剂业务系统对资源的使用。
 (四)建立自动化流程,实现流程驱动的业务系统运维自动化。实现日常事务性工作的流程化与自动化,并通过与监控平台的交互,对作业运行状况监控;实现业务流程集中、安全、标准化的访问控制;使用标准化步骤,强制操作合规,防止错误操作的发生。
(五)规范运行管理,有序开展运行维护。参照ITIL规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。运行维护管理应根据相关制度进行,对内完善流程,加强管理,使流程更规范更合理,使维护人员具备更高的工作教率,提高业务技术能力和解决实际问题的能力。
 (六)共享维护经验,完善知识库。把维护过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机制,提供了信息共享和交流的平台,提高了维护人员的工作效率。
(七)全面直观的系统管理展现。通过一个统一的门户系统展示系统,有效的展示企业内部的IT资源运行情况、性能状况等,使领导、管理者、技术人员能迅速了解自己关心的问题。
(八)将监控系统的消息处理平台与运维流程平台(ITIL平台)进行有效集成,使得关键监控消息能够自动转发到ITIL平台,然后由ITIL平台按照设计进行分配并监控事件的解决。
(九)对各类事件进行归纳与统计,做到能够发现阶段性的重点问题,供技术管理人员进行评估,并调集资源集中解决。

三、系统功能
 1.系统采用SNMP+WMI技术,实现网络的监测。
 2.系统中可以对网络、设备、信道进行实时监测。
 3.多方面判断设备的通断(PING、TCP、UDP、SNMP等),并且设置设备及网络的超时时间,更灵活,更方便。
 4.系统中可对故障现象进行维护,在同类现象发生后给出故障的解决方案。
 5.网络中有多个视图(实时监测、流量视图、端口视图、告警视图、资源视图、响应视图、总运行视图、运行详细视图等),满足客户的多方面需求。
 6.服务端使用中间件使系统分布式应用于各种平台和设备。
 7.丰富的查询及报表功能,让用户总结各种网络的情况。