- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
下一代网络架构测试平台–IxNetwork 5.40
2.2.2 快速隔离和发现服务降级问题测试
下一代的网络路由器都会支持多种混合业务和超高端口密度以及吞吐量。网络设备制造商面临复杂测试场景和高扩展性测试的压力与挑战,在这种高密度和复杂测试要求下,快速故障定位和问题查找是测试过程中面临的重要问题,IxNetwork 5.40 可以在上百个端口、上百万条流的复杂测试环境中快速进行故障定位和选择出所关心的业务流量。
IxNetwork可以对多个数据包字段根据用户需要进行实时追踪;通过多个等级的统计结果可以快速准确的找到所关心的测试业务流量,帮助快速判断出问题所在;另外,在IxNetwork结果统计上还可以设置过滤功能和搜索条件,快速找到需要的测试结果,表2是该特性测试所用到的主要IxNetwork结果统计特性。
比如,使用IxNetwork 强大的协议向导功能实现MPLS L3 VPN的扩展性测试,Ixia端口分别仿真大量的CE和PE路由器,每个VPN都可以包括多条路由,IxNetwork的控制层面仿真与每端口的高性能能力结合可以充分对被测设备PE路由器的控制层面产生压力,结合ViperCore的流量处理功能,产生GE或者10GE的线速流量运行在每个VPN里面的每条路由上。Ixia 目前最常用的、也是目前业界端口密度最高的测试模块LSM1000XMV16,经过实验室里面的测试,并通过第三方实验室IsoCore的认证,每两个端口就可以达到下面的性能:
800 eBGP peers with 300K routes
68 OSPF adjacencies with 10K routes
22 OSPFv3 adjacencies with 1K routes
4 PEs with 550K VPN routes
50 iBGP+ peers with 10K routes
而市场上的同类型性能测试工具,可能需要超过6个端口才能达到上述性能。
2.2.3 TrueView 的收敛时间测试
网络出现故障并进行快速恢复是当前网络设计必须要考虑的一个原则,当网络出现故障时,网络要求具有自动切换到备用链路上并进行正常业务转发的能力。网络收敛是指当网络出现故障或者异常事件时,需要将正常业务从主链路上切换到备份链路上,一旦流量都切换到备份链路上并且没有流量数据丢失,表示收敛已经发生。因为IP网络采用动态路由协议学习地址的方式,所以当所有的动态路由和相应路由表之上的流量都切换到备份链路上才表示完成了网络路由的收敛。
交换机和路由器等网络设备一般都必须具有出现故障自动倒换的Failover功能,这些功能一般是通过专用协议或者协议的扩展实现的,承载重要数据和业务的网络必须要具有高可靠性,这就需要网络设备具有上述特性。
当链路断掉时,路由协议,比如RIP, OSPF, ISIS和BGP都具有重路由流量(Re-Route Traffic)的特性。在OSI模型的第二层上,STP/RSTP/MSTP和LDP/RSVP-TE等协议也都提供了上述类似的重定向流量(Re-Direct Traffic)的特性。下一代网络要求具有更快速的故障收敛时间以保证高可靠性业务的不中断,这些技术包括平滑重启(Graceful Restart)、无中断重启(Hitless Restart)、虚拟路由冗余协议(VRRP)、MPLS快速重路由、双向转发检测协议(BFD)、以太网OAM/CFM和协议时间的处理等。
引起网络收敛的因素很多,根据OSI模型,这里将引起收敛的失败因素也按照"层数"进行分类。
物理层:典型的故障类型包括:某系统断电,链路被切断、设备不能启动(电源失败、内存损坏、CPU 模块不工作、接口模块不工作等。)
数据链路层:典型的故障类型主要和协议有关,包括:ARP解析失败,STP/RSTP/MSTP误配置、系统问题(系统软件工作异常等),认证失败(802.1x)等。
网络层:典型的故障类型包括:系统故障(软件故障等),错误的配置,路由相关的问题,包括但不限于邻居关系失败、路由震荡,路由过滤和路由重分布等。
收敛有流量收敛和协议收敛两种类型。传统的流量收敛有两种计算方法:
第一种是收敛时间=(发送数据包数量–接收数据包数量)/发送数据包的速率,测试示意图见图2。包括两种情况。数据平面的切换和恢复。
第二种为时间戳计算方法:测试仪表会对网络收敛前主链路收到的最后一个数据包进行计时,称为Last Timestamp,并且也会对收敛成功后从相应的备份链路上收到的第一个数据包进行计时,称为First Timestamp,First Timestamp减去Last Timestamp就是精确的网络收敛时间。
另外还有协议收敛时间的测试,同样需要测试仪表能够记录协议从"Down"状态到"Up"状态的时间差 ,这种协议收敛通常和相应协议本身的计时设计有关。测试示意见图3。
上述计算方法比较简单直观,也很容量理解,但是不适合用于大量地址表存在下的收敛测试,因为在这种情况下,更新所有地址信息到备份链路上需要较长时间,这也就需要较长的时间恢复相应的业务流量到故障之前的数值。
另外还有一种常见的收敛时间测试方法,就是在接收侧采用高速采样和捕获缓存的方法。这种方法非常有效并且可以分析抖动等指标,但受限于高速采样的频率和捕获缓存的大小,并且不能实时分析。目前该计算方法被广泛接受,可以比较准确地计算出检测到故障到故障恢复的时间,但有一定的局限性,就是只能在接收侧进行分析,并且和引起故障的事件没有关系。
Ixia IxNetwork 5.40 引入了业界当前最为完整、也是当前惟一的控制层面和转发平面结合的称为TrueView的收敛时间测试方法,这一测试方法目前正在申请专利。图4是Ixia TrueView 收敛时间测试的各个参数定义示意。
来源:IXIA