- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
利用串行RapidIO连接功能增强DSP协处理能力
1. 用于SRIO的Xilinx端点IP为软性LogiCORE解决方案。对于通过逻辑(I/O)和传输层上的目标和发起接口源出和接收用户数据,都支持完全兼容的最大有效载荷操作。
2. 缓冲层参考设计作为源代码提供,可自动重新划分包的优先级别并调整队列。
3. SRIO物理层IP可实现链路培训和初始化、发现和管理以及错误和重试恢复机制。另外,高速收发器在物理层IP中例化,可支持线速率为1.25Gbps、2.5Gbps和3.125Gbps的1通路和4通路SRIO总线链路。
4. 寄存器管理器参考设计允许SRIO主机器件设定并维护端点器件配置、链路状态、控制和超时机制。另外,寄存器管理器上提供的端口可供用户设计探测端点器件的状态。
用于SRIO的整个Xilinx端点IP LogiCORE解决方案已全面经过测试,硬件验证也已进行,目前正在就与主要SRIO器件供应商之间的协同工作能力接受测试。LogiCORE IP通过Xilinx CORE Generator软件GUI工具提供,该工具允许用户定制波特率和端点配置,并支持流量控制、重发送压缩、门铃和消息接发等扩展功能。这样,您便可创建一个灵活、可扩展的定制SRIO端点IP,对自己的应用进行优化。
Virtex-5 FPGA计算资源
用于SRIO的Xilinx端点IP可确保在使用SRIO协议的链路双方间建立高速连接。在最小的Virtex-5器件中,IP仅占用不到20%的可用逻辑资源,因此可确保用户设计使用大多数逻辑/存储器/I/O,集中实现系统应用。让我们一起看一下Virtex-5器件资源。
逻辑模块
Virtex-5逻辑架构带有基于65nm工艺的六输入查找表(LUT),可提供最高的FPGA容量。进位逻辑经过改进后,该器件的性能比之前的器件高出30%。由于所需LUT减少,该器件的功耗明显降低,且具备高度优化的对称布线架构。
存储器
Virtex-5存储器解决方案包括LUT RAM、Block RAM及与大型存储器进行接口的存储器控制器。Block RAM结构包括预制FIFO逻辑,即可用于外部存储器的嵌入式检错和纠错(ECC)逻辑。另外,Xilinx可通过存储器接口生成器(MIG)工具向系统设计中的例化存储器控制器模块提供综合设计资源。这样,您便可利用经过硬件验证的解决方案,并将精力集中于设计中的其他关键部位。
并行和串行I/O
SelectIO技术几乎可在设计中实现客户所需的任何并行源同步接口。使用SelectIO接口,可方便地针对40多种不同的电气标准创建符合行业标准的各类接口,也可创建专用接口。SelectIO接口提供的最大速率为700Mbps(单端)和1.25Gbps(差分)。
所有Virtex-5 LXT FPGA都装有一个GTP收发器,运行速度介于100Mbps到3.2Gbps之间。另外,GTP收发器在业界属于最低功率MGT之一,每个收发器的功率小于100mW。引入用来简化设计的成熟设计技术和方法后,高速串行设计的流程变得简单快捷。
另外,通过新设计工具(RocketIO收发器向导与IBERT)和新硅片性能(TX和RX均衡与内置伪随机位序列(PRBS)生成器和检查器),可以开发移植架构的各种功能和优势,从并行I/O标准到30多种串行标准及新兴的串行技术。
DSP模块
每个DSP48E Slice可提供550MHz的性能水平,允许您创建要求单精度浮点性能的各类应用,如多媒体、视频和图像应用以及数字通信。这扩展了器件的功能,使其优于之前的器件,同时还提供了功率优势,动态功耗的降低幅度超过了40%。Virtex-5 FPGA中还增加了DSP48E Slice的数量,这些模块相对于可用逻辑资源及存储器的比率从而得到了优化。
集成I/O模块
所有Virtex-5 LXT FPGA器件都具备一个端点模块,用来实现PCIe功能。通过这种硬IP端点模块,只需简单地重新进行配置即可不费吹灰之力轻松地从x1扩展至x2和x4或x8。该模块(x1、x4和x8链路)已通过严格的PCI-SIG兼容性和协同工作能力测试,用户可放心用于PCIe。
另外,所有Virtex-5 LXT FPGA器件均装有三态以太网媒体访问控制器(TEMAC),速度可达10/100/1,000Mbps。该模块可提供专用以太网功能,再结合Virtex-5 LXT RocketIO收发器和SelectIO技术,可方便您与许多网络器件进行连接。
利用针对PCIe和以太网的这两种模块,可以创建一系列定制包处理和网络产品,这些产品可大幅降低资源利用率和功耗。通过使用Xilinx FPGA中提供的这些各式资源,可以轻松创建并部署智能解决方案。
让我们看一下利用SRIO和DSP技术的一些系统设计示例。
SRIO嵌入式系统应用
可以考虑围绕基于x86架构的CPU构建一个嵌入式系统。CPU架构已高度优化,可轻易满足要求玩弄数字于股掌的各类应用。您可以轻松地在使用CPU资源的硬件和软件中实现各类算法,以执行不需要进行大量乘法运算的电子邮件、数据库管理以及文字处理等功能。性能以每秒钟所产生的指令/运算为数百万还是数十亿来衡量,而效率通过完成特定运算所需的时间/周期来衡量。
需进行大量定点和浮点运算的高性能应用在处理数据时需花费较长时间。这方面的示例包括信号过滤、快速傅里叶变换、矢量乘法和搜索、图像/视频分析和格式转换以及简单的数字处理算法。在DSP中实现的高端信号处理架构可轻松执行这些任务,并可优化此类运算。这些DSP的性能以每秒钟进行多少次乘法和累加运算来衡量。
您可以方便地设计使用CPU和DSP的嵌入式系统,以充分利用两种处理技术。图6表示使用FPGA、CPU和DSP架构的系统示例。
图6:基于CPU的可扩展、高性能、嵌入式系统。
高端DSP中的主要数据互连为SRIO。x86 CPU中的主要数据互连为PCIe。如图6所示,您可轻松部署FPGA以扩展DSP应用或对离散数据互连标准(如PCIe和SRIO)进行桥接。
在图6所示系统中,PCIe系统由根联合体芯片组托管。SRIO系统由DSP托管。32/64位PCIe地址空间(基址)可智能化地被映射至34/66位SRIO地址空间(基址)。PCIe应用可通过存储器或I/O读写与根联合体进行通信。这些事务会通过NRead/NWrite/SWrite轻松映射至SRIO空间。
在Xilinx FPGA中设计此类桥接功能很简单,因为这些Xilinx端点功能模块、PCIe和SRIO的后端接口都很相似。这样,"包队列"模块便可执行从PCIe到SRIO或反方向的交叉任务,从而建立可穿越两个协议域的包流。
SRIO DSP系统应用
在DSP处理为主要架构要求的应用中,系统架构可按图7进行设计。
图7:DSP密集型阵列。
基于Virtex-5 FPGA的DSP处理与系统中的其他DSP器件结合即可构成智能协处理解决方案。如果使用SRIO作为数据互连,整个DSP系统解决方案就可以方便地进行扩展。此类解决方案能够适应未来的发展变化,提供了延伸性,而且受多种形状因子的支持。在DSP密集型应用中,通过将相应处理任务卸载至x86架构中可实现快速数字分析或数据处理。使用Virtex-5 FPGA可轻易地连接PCIe子系统和SRIO架构,从而实现高效功能卸载。
SRIO基带系统应用
现有3G网络正在以较快的步伐迈向成熟,OEM也在为缓解特定容量和覆盖率问题而部署新的形状系数。要解决此类特殊问题,对市场趋势做出评估,基于FPGA的DSP架构是理想选择,该架构将SRIO用作数据层面标准。另外,早期DSP系统可快速升级,变为快速、低功耗FPGA DSP架构,从而获得可扩展性优势。
如图8中的系统所示,您可以对Virtex-5 FPGA进行设计,以满足现有对天线流量的线速率处理需求,还可通过SRIO提供与其他系统资源间的连接。现有早期DSP应用的固有并行连接速度较慢,因可应用于Virtex-5 FPGA的SRIO端点功能的存在,移植这些应用极为方便。
图8:可扩展基带上行链路/下行链路卡。
本文小结
SRIO正出现在大量新应用中,主要以有线和无线应用中的DSP为中心。在Xilinx器件中实现SRIO架构的主要优势包括:
1. 整个SRIO端点解决方案的可用性;
2. 灵活性和可扩展性,便于使用同样的硬件和软件架构制成不同级别的产品;
3. 通过新GTP收发器和65nm技术实现了低功耗;
4. 通过CORE Generator软件GUI工具轻松进行配置;
5. 与业界领先的供应商间的硬件协同工作能力经过了验证,支持其器件上的SRIO连接;
6. 通过使用PCIe和TEMAC等集成I/O模块,实现了系统集成,从而降低了总体系统成本。
另外,Virtex-5 FPGA所具备的DSP资源可在功耗、性能和带宽方面满足现有早期DSP系统的要求。更多优势还体现在系统集成方面,诸如以太网MAC的功能模块、用于PCIe的端点模块、处理器IP模块、存储元件及控制器等等。另外,由于IP核的详尽列表支持在FPGA中进行多种源整合,可以大大节省总体系统成本。
作者:Xilinx公司平台解决方案部技术营销经理 Navneet
来源:21IC电子网