- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
打造高效调度,简单运维的OTN网络
OTN网络引入城域后,运营商原有的SDH网络运维人员面对的是全新的网络结构和复杂的业务模型。以传统的经验,显然难以支撑起OTN网络的运维。
随着网络技术和智能终端的发展,城域网中IP业务逐渐成为最大的业务类型,大颗粒业务需求也逐步增加。这种变化对城域传送网提出了大容量、粗管道、IP化和高可靠的要求。OTN网络由于对高带宽承载的经济性,同时又能支持细颗粒业务灵活调度,成为打造超宽带城域网的必然选择。
OTN大量进入城域网络后,原SDH运维人员面临OTN网络运维的挑战。一方面是OTN网络运维的工作量相对于SDH网络有所增加。另一方面,OTN网络的复杂度远高于SDH网络,从设备管理、业务发放、告警排障和资源管理各个方面都与SDH网络有很大差异。运维人员以传统的SDH运维经验,难以支撑OTN网络运维。
OTN网络运维复杂在哪里?
OTN网络运维的复杂性,具体体现在以下四个方面:
设备内部关系难以透视:传统的SDH设备,基本上可以看作是一个黑盒,设备内连纤简单。而OTN设备内部存在大量子架,并且子架内部和外部都有光纤连接,不同连纤的信号流向都不一样。发生故障的时候,无法判断是内部光纤还是外部光纤的问题。
业务层次多且参数配置复杂:SDH技术本质上是对数据帧进行分插复用,只有一个层次业务模型。而OTN技术有6个层次业务模型,需要配置6个层面的业务。这就使得同样配置一条业务,在SDH网络上只需要2分钟,而在OTN网络上,需要花费20分钟以上,OTN业务配置时间是SDH的10倍。
无效告警数量多且定位困难:OTN网络的告警特别多,但很多都是无效告警,真正代表根因的有效告警隐藏在海量告警里面,识别和定位困难。OTN网络包括6个层次,各层次都有独立开销,会产生相应告警,最终会导致无效告警数量很多,运营商难以定位出根源告警。比如,当一个物理光纤发生中断时,光纤上面承载的所有业务都会受到影响而上报告警,这就使一个设备会产生上千条告警。如果要排除非根因告警,找到真正的故障原因,往往需要数小时甚至一天的时间。
资源利用率低且状态不可知:在OTN网络中,一般情况下,运营商对新业务发放和开通周期的期望是1周左右,但实际上新业务的开通周期往往超过2周。这是因为当新的业务发放时,运维人员首先需要了解网络资源的使用情况,再进行规划和部署。如果遇到资源不足,还需要临时扩波或者扩容。
不仅如此,运维OTN网络和SDH网络的往往是同一个部门的运维人员。OTN网络的复杂性,增加了原有SDH运维人员的学习成本,降低了运维效率。因此,如何使原SDH运维人员能平滑地过渡和胜任OTN网络的运维是个业界难题。
让OTN运维"SDH Like"
为解决这个问题,华为在OTN网络运维上提出了"SDH Like"的运维理念,通过华为网管,让OTN网络的运维模式尽可能继承SDH网络的简单运维方式,让运维人员能平滑地运维好OTN网络。
信号流图揭秘OTN设备内部玄机
针对OTN设备内部结构复杂的问题,网管通过信号流图的方式呈现OTN内部的数据流向,将OTN网元内部各种单板/子架间的光纤连接、告警信息和波长信息清晰地呈现在运营商面前,使OTN网元像一个白盒,让运营商可以充分掌握OTN设备内部的业务配置,包括各个波长的走向。
有了信号流图,OTN网元内外部关系一览无余,运维人员只需要在网管上点击查看即可维护OTN网元,不需要频繁到物理设备前去获取相关信息。
K是荷兰综合运营商,其在城域部署了超过5000套的波分设备。对于K的运维人员来说,最头疼的问题是光纤错连或者单板插错。一旦发生这种错误,排查效率低、业务中断时间长,平均每月因为光纤错连或者单板插错导致业务中断时间超过5个小时。使用了网管的信号流图功能后,光纤错连或者单板插错事故基本消失。即使发生故障,只需要在网管界面上点击查看即可快速定位,不再需要频繁到物理设备面前去进行低效的排查工作。
和SDH统一风格的端到端业务调度
在用户业务创建感知方面,网管能够包装简化OTN业务模型,把OTN原来6个层次(OTS、OMS、Och、OTUk、ODUk、Client)的业务统一简化成2个层次(Och、Client)。用户只需要手工创建Och路径和Client路径,即可完成OTN的业务发放。
与SDH端到端的业务调度风格一致,OTN的业务层次经过简化以后,运维人员只需要在图形化界面上点击源和宿,中间路由和参数都通过自动计算完成。这样,熟悉SDH端到端的运维人员能够很快进行OTN的端到端运维。
L是北美最大的带宽出租运营商,2011年L平均每月新开通波长业务150波,预计2012年平均每月新开通波长业务300波以上,平均每天要开通波长业务超过15条。由于太过复杂,L的运维人员按照OTN业务模型进行逐层配置,每天最多只能开通5条业务,开通速度跟不上业务发展速度,阻碍了L达成盈利目标。网管对OTN业务模型简化以后,L的业务发放效率提高了6倍,每天业务开通数量超过30条,有力保障了其业务的迅速发展。
基于根因故障快速定位
通过对OTN 6个层次之间的关系进行分析,华为发现6个层次之间的告警存在关联关系,从而能够创建出OTN不同层次告警之间的相关性分析规则。按此原理,网管能够提供对OTN网络的根因故障分析,屏蔽非根因告警,过滤出根因告警。此外,网管还可以提供业务级告警分析功能,运营商可以据此快速判断哪些告警影响了业务,从而优先对影响业务的告警进行排障处理。
北欧主流运营商T一直采用OSS系统进行故障定位。当网络发生故障的时候,告警上报给OSS系统,运维人员通过OSS系统进行故障定位和排障。2010年,T将OTN引入城域网络,网络业务包括光层和ODUk等多个级别的电层业务。在网络测试过程中,T发现当光层发生断纤的时候,全网共有1000多条告警上报给OSS系统,运维部门人员无法通过OSS系统定位是哪里出了问题,无法维护网络。T采用网管后,由网管提供告警相关性分析抑制功能,先在网管对OTN网络上报的告警进行分析过滤,从1000多条锐减到十几条根因告警,然后再上报给OSS系统。这样,T能够像以前一样,通过OSS系统快速定位出光纤中断并且排障。
带宽资源池管理让资源零浪费
网管对OTN网络的资源进行抽象管理,形成带宽资源池管理。基于此,带宽资源池可以按照不同业务粒度与不同维度进行组合统计,并输出带宽资源报表。这样,用户可以随时掌握OTN网络的资源使用情况,以便进行网络扩容调整。
通过带宽资源池管理功能,运维人员能够快速找到当前充足的资源开通业务,使整个开通过程只需要几分钟,大大缓解了业务开通的压力。基于网管提供的OTN资源报表,运维人员可以定期输出当前OTN网络的资源占用情况分析报告,包括资源预警和扩容建议。
随着网管的使用,OTN网络的运维也能像SDH网络一样简单高效。这样尽可能减少了原有SDH运维人员的学习成本,使他们能够平滑切换到OTN网络的运维中,快速掌握OTN网络运维能力。
华为网管通过继承原有SDH网络良好的运维经验和优点,并结合OTN网络的特点,推出一系列简化OTN运维的特色功能,使OTN网络运维真正做到了"高效调度,简单运维"。
作者:李波 来源:《华为技术》