深度分析IP数据网综合网管系统开发

日期: 2009-06-28 来源:TechTarget中国

  IP数据网不同于分组交换、DDN、帧中继、ATM等基础网络,它是一个开放的系统,因此,IP数据网的管理有其特殊的复杂性。从技术角度出发,IP网管系统就是要具备足够的监控手段,对网上事件做出快速反应,提供故障隔离措施,并依赖有效的操作控制手段,尽快解决故障,保证网络的正常运行,实现集中操作和维护管理。IP网管系统要求对IP数据网上的故障、性能、配置、环境等信息进行全面的掌握,对网络整体和局部的流量、流向,网元设备的负荷情况等,提供实时统计的数据,以此作为网络优化和网络扩容的参考。IP网管系统要求故障和告警处理实现自动化,并逐步建立和完善故障处理的知识库,同时,IP网管系统要求提供基于定制的特殊服务,以对该IP数据网进行更加有效的管理。对于各种新业务,如VoIP、VPN等,提供相应的基于业务的管理手段和工具,实现面向用户层的QoS管理,为用户提供SLA(服务等级协议)管理等,也是IP网管系统发展的一个重要趋势。
  
  一、IP数据网网络管理的现状

  考察当前的各种IP数据网网管系统,我们发现有以下局限,严重束缚了网管系统的效能:

  采用轮询任务繁重、时间长的集中轮询方式,降低了网络效能;

  不同厂商的多个功能各异的网管软件在同一个网络上运行,彼此之间耦合性差,造成轮询重复,浪费系统资源,降低了网络性能;

  现有网管软件的运行分析功能单一,不能对长期数据进行统计分析并给出决策支持,缺乏智能化;

  缺乏对各种服务业务的有效管理,当前企业用户对基于应用服务的SLA管理提出了较高的要求;

  网管系统的开发性和可扩展性应基于Web的网络管理,网络设备和接口的标准化应提供对corba的支持等。

  鉴于上述不足,新的综合网管系统的开发应在上述几个方面进行重点研究与突破,使网管系统能跟上IP网络的快速发展,真正发挥管理的功能,并能指导网络的规划与发展。

  二、IP数据网综合网管系统的基本框架和分类介绍

  与传统的IP网管系统一样,综合网管系统主要由五大部分组成:配置管理、性能管理、故障管理、业务管理和安全管理。

  1.配置管理

  配置管理功能主要负责全面动态地管理全网所有网元设备的配置数据、设备保障、状态检查和安装功能,能够以图形、文字等形式分层显示配置相关的各类信息,并且具有编辑(增加、删除、更改)、分类统计和打印输出这些数据的功能。

  设备配置数据包括系统内各网元生成的设备配置参数,也包括根据设计文件及管理资料人工生成的参数两部分内容。对配置数据的管理包括配置文件的生产和获取,配置文件的维护和编辑,制定配置计划,进行配置校验和配置结果模拟并使配置生效等。用于配置管理的软件主要有针对Cisco设备的Cisco Netsys Baseliner、CWSI、ACL Manager(其中后两者包括在CiscoWorks2000网管工具集当中);HP OpenView网管平台也提供了相应的功能模块支持配置管理,OpenView的NNM(Network Node Manager)可以自动发现网络节点,生产网络拓扑图,并对各种网络事件进行处理。

  综合网管系统的配置管理系统由四个部分组成:网元管理平台、基本配置管理、高级配置管理、用户公共接口。网元管理平台一般是设备厂商提供的设备管理平台,负责与设备直接通讯,基本配置和高级配置管理完成配置功能,用户公共接口不仅提供用户访问管理功能的接口,同时还提供与其他管理功能的接口。

  在配置管理中,通过网络拓扑图,网管人员可以对整个网络结构有形象地了解,设备配置信息和网络流量报警也可在拓扑图上直观地显示。为此,研发人员在汲取NNM在拓扑显示方面的优点后,基于JAVA语言自行开发了CHINANET骨干网网络拓扑显示功能模块。除对网络设备可进行拓扑发现外,该模块还可分层(骨干网分全国和八大区两层)显示网络拓扑,对网络设备和链路配置信息进行查询,实现拓扑图上的流量报警,并针对骨干网网管的特殊需求,实现了实时路由监测和ISIS路由仿真功能,这对骨干网网络优化和发展建设具有指导作用。该功能模块实现了Web化,在权限许可范围内通过浏览器访问APPLET的方式即可进行。

  系统可以基于HP NNM提取的管理信息生产网络拓扑,也可通过SNMP协议直接从骨干网设备的Agent中取得所需的MIB信息并存入数据库。后一种数据采集方式有利于采集数据的维护,基于定制的新功能的开发,并且免去了与NNM的数据接口。由于是“按需而取”,采集的数据量很小,不会造成网络资源的浪费。

  2.性能管理
  
  性能管理主要负责全网性能监视、性能控制和性能分析,完成链路性能测试以及各类性能信息的收集、统计、存储,同时还负责性能信息数据库的维护,性能管理阈值的设置与阈值越过报告,产生按需的性能报告,系统基于性能报告和统计分析,通过运行管理功能和配置管理功能对网络进行调整,以达到改善网络总体性能水平的目的。性能管理功能包括数据信息采集、性能信息的统计和存储、性能管理阈值处理和性能报告生产等部分。研发人员采取的实现方案是:自主开发和与第三方软件相结合,自主开发的软件通过第三方接口来获取信息,并对信息进行再加工分析、提取、归类、统计以及与其他管理模块进行信息交互,对网络进行实时动态监控并获取相应性能参数,及时地与其他模块互动。

  性能管理系统通过Cisco NetFlow软件,采集路由器各端口基于QoS 级的数据流,捕获每个网络流量的分类和优先权,在服务质量的基础上区分数据流并加以处理,生产相应报表。NetFlow采集数据还可用于平衡网络的负载,查找网络的故障,优化网络的性能以及SLA吞吐量监测和基于数据流的计费等方面。

  系统用Cisco IPM(Internet Performance Managerment)软件,通过发送echo、pathecho数据包测定网络的响应时间,进而可以采集网络时延、丢包率和抖动等网络性能参数,生产反映网络服务质量的报告,指导网管人员使用相应的QoS策略,实现对企业用户的SLA管理。

  基于HP OpenView的NetMetrix、Network Hearth/Concord等软件,系统可以发现并隔离网络故障,反映网络性能趋势,监测网络资源和性能,测定流量峰值并产生相应报表。

  3.故障/告警管理

  故障/告警管理实现对数据网内所有网元设备的告警监测和故障定位,配合运行管理功能进行故障排除和系统设备复测,还能收集和处理各网络单元(NE)的各种故障、告警及网络状态异常信息,并具有各种分类统计和指导分析的功能。

  告警/故障管理主要包括以下内容:告警数据的采集和存储、定制告警分类和级别、告警数据过滤和相关性分析、告警的实时显示和生成报表、告警/故障处理、告警/故障数据库的维护以及与知识库系统的接口等。故障/告警管理以工作流的方式,提供了网管的自动化功能,通过一系列的工具和接口,帮助系统人员完成日常维护和管理工作。本系统中常见的工作流为值班日志和故障工作流。

  该系统作为网管系统功能中最重要的一部分,对故障和告警管理功能的要求非常细致,有多种第三方软件提供故障管理功能,并且在实现功能上各有侧重。为开发综合的故障和告警管理系统,研发人员的任务主要是对各种第三方软件在功能实现、体系结构、扩展性和灵活性、再开发性和售后服务等方面经过对比,采用自主开发和三方软件相结合的解决方案,在选定的第三方软件的故障管理平台上,利用其采集的数据进行综合处理与再分析,并基于用户提出的特殊需求开发定制的功能模块。自主开发软件的功能侧重于与第三方软件的无缝集成。

  在CHINANET骨干网网管项目的告警/故障管理模块中,研发人员选取Micromuse/Netcool作为主要的故障管理平台,HP OpenView NNM 作为其补充,自主开发软件完成可定制的管理界面的生成、基于工作流的故障发现、工作流程设计、与其他管理模块间的接口与互动、在网络拓扑图上的链路故障/告警显示以及故障/告警解决知识库的维护等。

  4.业务管理

  该系统应实现基于应用/服务的网络管理,向网管人员明确反映网络的实时质量状况,为网络规划提供信息,并能提供有区别的服务,针对用户需求,特别是按照企业大用户的需求,提供基于QoS的服务级别协议(SLA)、计费等功能。综合网管系统对业务管理的功能划分以及与其它管理模块的集成进行了大量的研究,提出的解决方案如下:

  对于网络的服务质量,使用Cisco的IPM软件,对骨干网中的Cisco设备收集相关数据,经分析处理可以获得反映网络QoS的时延、丢包率、网络吞吐量等参数,进而生成QoS性能评价报告;

  对于应用的服务质量,基于Netcool的ISM软件,可以对多达18种应用层协议(包括DHCP, DNS, FTP, HTTP, RADIUS, POP3, SMTP等)的服务质量进行监视,并生成性能报告;相同的功能也可由自行开发的软件,完全按照用户的定制来实现;

  针对IP网的特殊应用服务(如VPN、VoIP、线路租用等),使用直接针对该项业务的QoS监测管理软件,可以获得更详细的QoS数据,有效地保证SLA管理水平。

  5.安全管理

  安全管理对全网安全起保证作用,主要功能包括:权限管理功能、数据安全管理以及安全检测功能。作为网络管理的基本功能之一,安全管理通过控制信息访问点来保护网络中的敏感信息。在设计过程中,应充分考虑保护敏感信息和允许网管人员访问适当信息以进行工作这两方面的需要,合理设置安全措施来保证系统和数据的安全。此外,对某些关键设计信息,如用户密码等,还应提供加密传输和存储功能以加强保护。研发人员采取的解决方案是RADUIS+TACACS。

   三、基于特殊定制的IP综合网管系统及其举例

  对于一个应用于特定场合的IP网管系统,基于定制的功能开发能够针对特定场合的特殊应用,完成网管人员最关心和最急待解决的问题,是IP网管系统高效可靠、有针对性地管理网络的关键。研发人员在网管软件的开发过程中,深入了解了CHINANET骨干网网管的特殊性和特别需求,开发出一系列解决骨干网网管实际问题的应用模块和小工具,给网管人员带来极大的方便。下面以ISIS路由仿真模块的设计为例子作简单介绍。

  CHINANET骨干网内部主要采用BGP和ISIS两种路由协议,大区间用BGP协议,大区内使用ISIS协议。骨干网网络复杂,链路流量大,宏观上缺乏一种工具,能够通过简单的模拟操作,指导对网络和设备进行有效配置,使整个网络的流量流向更趋于合理,使网络拥塞尽量减少。ISIS路由仿真模块正是基于这样的目的而开发的。

  ISIS路由仿真模块位于网络拓扑显示部分,在网络拓扑图基础上,选定源点,根据网络中所有通过ISIS路由协议获得路由的metric值,计算出一条最短路径在拓扑图上以不同颜色的线反映处理;当网管人员出于减轻某段链路流量的考虑而改变一条或多条路由的metric值时,该模块重新执行最短路径算法(Dijkstra算法),计算并画出新的最短路径。该模块通过更改前后最短路径的变化可以指导网管人员对网管设备(如路由器路由协议的优先级别等)进行相应配置,从而达到提高网络效能、负载均衡等目的。由于当前所有的第三方软件都没有提供类似的路由仿真功能,因此研发人员开发的ISIS路由仿真模块在传统网管系统所要求的网络拓扑分层显示的基础之上,为骨干网网管人员完成网络优化这一复杂任务提供了一种简单有效的方法。

  四、IP综合网管系统的发展方向

  现代计算机网络已经演化成多种体系结构的网络互联,这种异质性对网管软件提出了新的要求。如何解决实际网络中地理的分散性、网络体系结构的复杂性、网络设备的自治性、网络状态的多变性以及网络通信量增长的爆炸性等问题,如何建立和维护一个网管体系分布化、网管系统综合化、网管界面Web化、管理结构标准化、网管系统智能化和面向服务的综合网络管理系统,以便有效地维护和管理网络,并对网络的发展和规划给予建设性的指导等等,对每一个网管系统开发人员和网络管理人员来说,都是值得思索的问题。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐