- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
最新网络收敛时间测试技术介绍
摘要
介绍了实现网络快速收敛的相关协议以及引起收敛的原因,IXIA正在申请专利的集成在IxNetwork产品中TrueView网络收敛时间测试技术和传统技术的差异。
1 引言
收敛(Convergence)描述了网络从故障恢复以及网络变更的方式。现代网络通过提供冗余或备用路径来应对预期的网络故障。故障倒换是指网络自动检测服务中断和调整并切换到备用路径的过程。重路由的信息流重新归并到无故障路径某点时,传输网络即发生了收敛。与之相反,故障倒回则是指修复服务中断后网络恢复至初始链路的过程。
图1描述了一个"客户端"计算机请求从"服务器"获得信息所经过的大型网络的很小部分。这些信息正常情况下由路由器R1,R2,主链接和路由器R3转发。想像一下,如果主链接可能因物理切断,路由器R3故障,网络过载或其他原因而中断的情况。路由器R2将首先发送连接中断通知,由于和"客户端"没有其他连接,连接中断将会反馈到路由器R1。路由器R1查找到"客户端"的备用路径,并找到通过路由器R4,R6,备用链接和路由器R3连接的路径。网络信息流在下面这条路径上转发。路径收敛于路由器R3,首次服务中断到路由器R3重新恢复全部流量转发之间的间隔时间就是收敛时间。
图1 故障恢复过程示意图
从技术上而言,所有受影响路由从主路径切换到备用路径后网络路由收敛才会视为完成。
2 网络收敛时间测试方案
2.1 实现快速收敛的协议介绍
在OSI模型的第2层,如果出现链接故障或网络变更,STP,RSTP,MSTP和LDP/RSVP-TE等交换协议便会提供流量重定向机制。如果出现链接或网络故障,第3层的RIP,OSPF,ISIS和BGP等路由协议有能力重路由IP流量。这些传统技术需要数秒方可完成,实际时间取决于其所处理网络的规模和复杂性。下一代网络要求快得多的恢复时间,以满足其高可用性要求。为实现快速故障倒换时间,众多扩展协议和新协议已被使用。这些协议包括:
(1)平滑无中断重启:路由器向邻近路由器发送其正在重启路由过程的消息,并要求邻近路由器在其重启期间继续转发数据包。
(2)虚拟路由器冗余协议(VRRP):定义并宣告一个"虚拟的"路由器为网关,两个或更多路由器为该网关提供服务。
(3)MPLS快速重路由:本地网络保护恢复机制。每条LSP均受备用路径保护。此机制满足实时应用要求,可以达到SONET环路不到50ms的恢复时间。
(4)双向转发检测:一种简单、高速的HELLO协议,可提供低开销、短期(低至1ms)的路径故障检测。
(5)OAM/CFM链接:提供以太网链接和服务故障检测和隔离。CFM可以完成低至10ms的服务中断检测的时间。
(6)协议计时器设置:网络通常使用路由协议的相对低速的HELLO机制,在硬件没有发送求助信号时检测故障。许多计时器均可以调低以减少反应时间。
服务提供商在服务等级协议(SLA)中向企业客户保证其服务的可靠性级别,通常为99.999%。这听起来毫无价值,但99.999%可靠性保证意味着一年中断累计时间超过5min。此项极富挑战性的要求导致网络服务提供商实施多项功能,最大限度地缩短故障时间,加快收敛时间。
受故障倒换影响的不仅仅是路由协议。路由器还需要转发大量流量,同时执行服务质量(QoS)和其他策略。信息服务器和负载均衡设备必须对付丢弃的包文和连接的冲击。因此,收敛测试必须在网络流量模仿用户真实负载的环境中进行。
2.2 网络中断的原因
网络连接中断的原因有很多,从明显的电源故障或线路切断到设备配置错误,或软件错误和升级导致的故障。以下的讨论旨在调查不同网络堆栈等级造成或发生的故障。
(1)第1层——物理层中断
导致物理层网络中断的故障范例包括:
●断电。即使是短暂的停电也会导致故障发生。
●线路切断。瞬时故障可视为线路切断所致。
●设备故障。可能是电源故障,损坏的内存,CPU插件故障或接口插件故障所致。
SONET网络包括此类故障的内置保护部件,但以太网没有此类内置保护部件。虽然物理网络连接拥有许多可行的选择,但以太网将作为下一代网络选择的要素显而易见。无论以太网链接使用的是铜线还是光纤,物理层设备(PHY)的管理界面只提供最低的链接故障可见度。至于网络接口方面,链接要么接上,要么没有接上。有效监测链接状况必须用到如OAM链接等更高级别的协议。
(2)第2层——数据连接层中断
交换机是第2层最常见的设备。导致第2层故障的原因可归类如下:
●容量。MAC地址数目达到容量极限。
●环境。环境过热可导致设备无法正常运行。
●硬件/软件故障。如果没有妥善规划并测试,IT网络操作人员移动、添加和更改软、硬件均会诱导硬件或软件故障。
●事件。认证问题(例如802.1x)、互操作性或配置错误。
故障发生的方式各种各样,包括流量泛滥或突降、流量受损、连接中断、高延时以及低性能、导致性能下降的间歇性流量突降、网络连接受限。
数据链接层使用的大多数协议均没有提供连接故障检测机制。举例来说,ARP协议被用于映射主机MAC地址到第3层IP地址,但是如果ARP失效,便没有任何恢复机制了。
有几种协议可解决第2层的故障,其中包括生成树,链接OAM,服务OAM,MPLS/RSVP-TE和BFD。STP,RSTP和MSTP等以太网生成树协议用于为交换网络提供冗余。这要求网络管理员仔细配置,以取得最佳性能,但仍然不会迅速收敛。
目前,有许多新协议正在加以标准化,以实现50ms或用时更少的收敛时间。目前,可用的快速故障检测和恢复的协议包括第2层(链接OAM,服务OAM,RSVP-TE快速重路由)和第3层(OSPF快速发送HELLO,双向转发检测BFD,虚拟路由器冗余协议VRRP)。
这些协议旨在检测故障,但通常需要与其他路由协议搭配使用,才能完成故障恢复。
作者:杨中贤 来源:电信网技术
闂傚倸鍊峰ù鍥敋瑜忛幑銏ゅ箛椤旇棄搴婇梺褰掑亰閸犳帡宕戦幘鎰佹僵妞ゆ劑鍨圭粊顕€姊洪棃娑欘棞闁稿﹤顭烽獮鎴﹀礋椤掑倻鎳濆銈嗙墬绾板秴鈻嶆繝鍥ㄢ拻濞撴埃鍋撴繛浣冲洦鏅煫鍥ㄧ☉閻掑灚銇勯幒鎴濐仼闁藉啰鍠栭弻鏇㈠醇濠垫劖效闂佺ǹ顑冮崝宥夊Φ閸曨垰鍐€闁靛⿵濡囧▓銈嗙節閳封偓閸曨剛顦伴梺鍝勭焿缂嶄線鐛Ο鍏煎枂闁告洦鍘归埀顒€锕娲偡閺夋寧些濡炪倖鍨甸ˇ鐢稿Υ娴e壊娼ㄩ柍褜鍓熼獮鍐閵堝懎绐涙繝鐢靛Т鐎氼厼鈻撻鍓х=闁稿本鑹鹃埀顒勵棑缁牊绗熼埀顒勩€侀弽顓炵闁挎洍鍋撶紒鐙€鍨堕弻銊╂偆閸屾稑顏� | More...
闂傚倸鍊峰ù鍥敋瑜忛幑銏ゅ箛椤旇棄搴婇梺褰掑亰閸犳帡宕戦幘鎰佹僵妞ゆ劑鍨圭粊顕€姊洪棃娑欘棞闁稿﹤顭烽獮鎴﹀礋椤掑倻鎳濆銈嗙墬绾板秴鈻嶆繝鍥ㄢ拻濞撴埃鍋撴繛浣冲洦鏅煫鍥ㄧ☉閻掑灚銇勯幒鎴濐仼闁藉啰鍠栭弻鏇㈠醇濠垫劖效闂佺ǹ顑冮崝宥夊Φ閸曨垰鍐€闁靛鍎崑鎾诲冀椤愮喎浜炬慨妯煎亾鐎氾拷婵犵數濮烽弫鎼佸磻閻愬搫鍨傞柛顐f礀缁犲綊鏌嶉崫鍕櫣闁稿被鍔戦弻锝夊箛闂堟稑鈷掑┑鐐茬墔缁瑩寮婚妸鈺傚亞闁稿本绋戦锟�闂傚倸鍊搁崐鐑芥嚄閸撲焦鍏滈柛顐f礀閻ょ偓绻濋棃娑卞剭闁逞屽厸閻掞妇鎹㈠┑瀣倞闁肩ǹ鐏氬▍鎾绘⒒娴e憡鍟炴繛璇х畵瀹曟粌鈽夐姀鈾€鎸冮梺鍛婃处閸忔稓鎹㈤崱娑欑厪闁割偅绻冮崳瑙勩亜韫囨挾鎽犲ǎ鍥э躬椤㈡洟顢楁担鍓蹭紦
闂傚倸鍊峰ù鍥敋瑜忛幑銏ゅ箛椤旇棄搴婇梺褰掑亰閸犳帡宕戦幘鎰佹僵妞ゆ劑鍨圭粊顕€姊洪棃娑欘棞闁稿﹤鐏濋悾閿嬬附缁嬪灝宓嗛梺缁樺姈椤旀牕危濞差亝鐓熼柣鏂挎憸閻苯顭胯椤ㄥ牓寮鈧獮鎺楀籍閳ь剟寮冲⿰鍫熺厵闁诡垱婢樿闂佺粯鎸鹃崰鎰板Φ閸曨垼鏁冩い鎰╁灩缁犺崵绱撴担鐤厡闁稿繑锕㈠濠氭晲婢舵ɑ鏅i梺缁樺姈缁佹挳骞愰崘顔解拺闁荤喐婢樺Σ缁樸亜閹存繍妯€闁绘侗鍣i獮瀣晝閳ь剛绮诲☉銏♀拻闁割偆鍠撻埊鏇㈡煕婵犲倿鍙勬慨濠勭帛閹峰懘鎼归獮搴撳亾婵犲洦鐓涢柛娑卞枤缁犵偤鏌曢崱鏇犲妽缂佺粯绻堝畷鍫曟嚋閸偅鐝﹂梻鍌欑閹测€趁洪敃鍌氬偍闁伙絽澶囬崑鎾愁潩椤撶偛鎽甸梺鍝勬湰閻╊垶鐛Ο渚富閻犲洩寮撴竟鏇㈡⒒娴e憡鎯堥柣顓烆樀楠炲繘鏁撻敓锟�
闂傚倸鍊搁崐椋庣矆娴h櫣绀婂┑鐘插€寸紓姘辨喐閺冨牄鈧線寮介鐐茶€垮┑锛勫仧缁垶寮悩缁樷拺闂侇偆鍋涢懟顖涙櫠椤斿浜滄い鎾跺仦閸嬨儳鈧娲滈幊鎾诲煡婢跺ň鏋庨柟閭﹀枛缁插潡姊婚崒娆戝妽闁诡喖鐖煎畷鎰板即閻忚缍婇幃婊堟寠婢跺矈鍞甸梺璇插嚱缂嶅棝宕伴弽顐や笉闁哄被鍎查悡娆徝归悡搴f憼婵炴嚪鍥ㄧ厵妞ゆ棁宕电粣鏃€鎱ㄦ繝鍛仩闁告牗鐗犲鎾偄閸濄儱绲垮┑锛勫亼閸婃垿宕硅ぐ鎺撴櫇妞ゅ繐鐗勯埀顑跨閳诲酣骞樺畷鍥舵Ч婵$偑鍊栭幐楣冨窗鎼淬劍鍋熷ù鐓庣摠閳锋垿鏌涘☉姗堟敾閻庡灚鐟╅弻宥堫檨闁告挾鍠庨锝嗙節濮橆厽娅㈤梺璺ㄥ櫐閹凤拷
婵犵數濮烽弫鍛婃叏娴兼潙鍨傜憸鐗堝笚閸婂爼鏌涢鐘插姎闁汇倗鍋撶换婵嬫濞戝崬鍓伴梺鍛婅壘缂嶅﹪鐛弽銊︾秶闁告挆鍚锋垶绻濆▓鍨仩闁靛牊鎮傚濠氭偄閻戞ê鏋傞梺鍛婃处閸嬪嫯顤傞梻鍌欑閹诧繝宕洪崘顔肩;闁瑰墽绮悡鐔煎箹濞n剙鈧倕岣块幇鐗堢厵妞ゆ棁鍋愰崺锝団偓瑙勬礃濞茬喖鐛惔銊﹀癄濠㈣泛鑻獮鎺楁⒒娴gǹ鎮戠紒浣规尦瀵彃饪伴崼婵囪緢濠电姴锕ら悧濠囨偂閺囩喆浜滈柟鏉垮閹偐绱掗悩绛硅€块柡灞剧☉椤繈顢橀悩鍐叉珰闂備浇顕栭崰娑綖婢跺瞼绠旈柣鏃傚帶閻愬﹦鎲稿鍥╀笉闁荤喖鍋婂〒濠氭煏閸繂鏆欏┑锛勬櫕缁辨帡顢欐總绋垮及濡ょ姷鍋涢ˇ顖濈亙闂佸憡渚楅崰妤€鈻嶉姀銈嗏拺閻犳亽鍔屽▍鎰版煙閸戙倖瀚�