• 易迪拓培训,专注于微波、射频、天线设计工程师的培养
首页 > 测试测量 > 技术文章 > 最新网络收敛时间测试技术介绍

最新网络收敛时间测试技术介绍

录入:edatop.com    点击:

摘要

介绍了实现网络快速收敛的相关协议以及引起收敛的原因,IXIA正在申请专利的集成在IxNetwork产品中TrueView网络收敛时间测试技术和传统技术的差异。

1  引言

收敛(Convergence)描述了网络从故障恢复以及网络变更的方式。现代网络通过提供冗余或备用路径来应对预期的网络故障。故障倒换是指网络自动检测服务中断和调整并切换到备用路径的过程。重路由的信息流重新归并到无故障路径某点时,传输网络即发生了收敛。与之相反,故障倒回则是指修复服务中断后网络恢复至初始链路的过程。

图1描述了一个"客户端"计算机请求从"服务器"获得信息所经过的大型网络的很小部分。这些信息正常情况下由路由器R1,R2,主链接和路由器R3转发。想像一下,如果主链接可能因物理切断,路由器R3故障,网络过载或其他原因而中断的情况。路由器R2将首先发送连接中断通知,由于和"客户端"没有其他连接,连接中断将会反馈到路由器R1。路由器R1查找到"客户端"的备用路径,并找到通过路由器R4,R6,备用链接和路由器R3连接的路径。网络信息流在下面这条路径上转发。路径收敛于路由器R3,首次服务中断到路由器R3重新恢复全部流量转发之间的间隔时间就是收敛时间。

图1  故障恢复过程示意图

从技术上而言,所有受影响路由从主路径切换到备用路径后网络路由收敛才会视为完成。

2  网络收敛时间测试方案

2.1  实现快速收敛的协议介绍

在OSI模型的第2层,如果出现链接故障或网络变更,STP,RSTP,MSTP和LDP/RSVP-TE等交换协议便会提供流量重定向机制。如果出现链接或网络故障,第3层的RIP,OSPF,ISIS和BGP等路由协议有能力重路由IP流量。这些传统技术需要数秒方可完成,实际时间取决于其所处理网络的规模和复杂性。下一代网络要求快得多的恢复时间,以满足其高可用性要求。为实现快速故障倒换时间,众多扩展协议和新协议已被使用。这些协议包括:

(1)平滑无中断重启:路由器向邻近路由器发送其正在重启路由过程的消息,并要求邻近路由器在其重启期间继续转发数据包。

(2)虚拟路由器冗余协议(VRRP):定义并宣告一个"虚拟的"路由器为网关,两个或更多路由器为该网关提供服务。

(3)MPLS快速重路由:本地网络保护恢复机制。每条LSP均受备用路径保护。此机制满足实时应用要求,可以达到SONET环路不到50ms的恢复时间。

(4)双向转发检测:一种简单、高速的HELLO协议,可提供低开销、短期(低至1ms)的路径故障检测。

(5)OAM/CFM链接:提供以太网链接和服务故障检测和隔离。CFM可以完成低至10ms的服务中断检测的时间。

(6)协议计时器设置:网络通常使用路由协议的相对低速的HELLO机制,在硬件没有发送求助信号时检测故障。许多计时器均可以调低以减少反应时间。

服务提供商在服务等级协议(SLA)中向企业客户保证其服务的可靠性级别,通常为99.999%。这听起来毫无价值,但99.999%可靠性保证意味着一年中断累计时间超过5min。此项极富挑战性的要求导致网络服务提供商实施多项功能,最大限度地缩短故障时间,加快收敛时间。

受故障倒换影响的不仅仅是路由协议。路由器还需要转发大量流量,同时执行服务质量(QoS)和其他策略。信息服务器和负载均衡设备必须对付丢弃的包文和连接的冲击。因此,收敛测试必须在网络流量模仿用户真实负载的环境中进行。

2.2  网络中断的原因

网络连接中断的原因有很多,从明显的电源故障或线路切断到设备配置错误,或软件错误和升级导致的故障。以下的讨论旨在调查不同网络堆栈等级造成或发生的故障。

(1)第1层——物理层中断

导致物理层网络中断的故障范例包括:

●断电。即使是短暂的停电也会导致故障发生。

●线路切断。瞬时故障可视为线路切断所致。

●设备故障。可能是电源故障,损坏的内存,CPU插件故障或接口插件故障所致。

SONET网络包括此类故障的内置保护部件,但以太网没有此类内置保护部件。虽然物理网络连接拥有许多可行的选择,但以太网将作为下一代网络选择的要素显而易见。无论以太网链接使用的是铜线还是光纤,物理层设备(PHY)的管理界面只提供最低的链接故障可见度。至于网络接口方面,链接要么接上,要么没有接上。有效监测链接状况必须用到如OAM链接等更高级别的协议。

(2)第2层——数据连接层中断

交换机是第2层最常见的设备。导致第2层故障的原因可归类如下:

●容量。MAC地址数目达到容量极限。

●环境。环境过热可导致设备无法正常运行。

●硬件/软件故障。如果没有妥善规划并测试,IT网络操作人员移动、添加和更改软、硬件均会诱导硬件或软件故障。

●事件。认证问题(例如802.1x)、互操作性或配置错误。

故障发生的方式各种各样,包括流量泛滥或突降、流量受损、连接中断、高延时以及低性能、导致性能下降的间歇性流量突降、网络连接受限。

数据链接层使用的大多数协议均没有提供连接故障检测机制。举例来说,ARP协议被用于映射主机MAC地址到第3层IP地址,但是如果ARP失效,便没有任何恢复机制了。

有几种协议可解决第2层的故障,其中包括生成树,链接OAM,服务OAM,MPLS/RSVP-TE和BFD。STP,RSTP和MSTP等以太网生成树协议用于为交换网络提供冗余。这要求网络管理员仔细配置,以取得最佳性能,但仍然不会迅速收敛。

目前,有许多新协议正在加以标准化,以实现50ms或用时更少的收敛时间。目前,可用的快速故障检测和恢复的协议包括第2层(链接OAM,服务OAM,RSVP-TE快速重路由)和第3层(OSPF快速发送HELLO,双向转发检测BFD,虚拟路由器冗余协议VRRP)。

这些协议旨在检测故障,但通常需要与其他路由协议搭配使用,才能完成故障恢复。

作者:杨中贤   来源:电信网技术

点击浏览:矢量网络分析仪、频谱仪、示波器,使用操作培训教程

上一篇:基于Microchip16位单片机的音频信号分析仪的设计
下一篇:思博伦通信Avalanche网络应用测试方案

微波射频测量操作培训课程详情>>
射频和天线工程师培训课程详情>>

  网站地图