动态矢量线程可在固定无线接入、vRAN和大规模MIMO波束成形等方面实现高效率

来源:CEVA #CEVA#
1.4w

现在,我们已经开始适应5G,网络运营商已计划采用 5G-Advanced的3GPP标准第18版。这一新版本支持众多功能,如扩展现实、厘米级定位精度和微秒级室外和室内定时精度,将引发RAN基础设施中计算需求爆炸式增长。

考虑为消费者和企业提供固定无线接入。通过大规模 MIMO RRU应用波束成形技术,必须管理繁重又不断变化的流量,而UE则必须支持运营商聚合。两者都需要更大通道容量。解决方案则必须更环保,保证高性能和低延迟,更有效地管理可变负载,更经济高效地支持大规模部署。

基础设施设备制造商希望将基于DSP的ASIC硬件的所有功耗、性能和单位成本优势,以及所有这些硬件的附加功能集成到一个更加高效的包中。

虚拟RAN和矢量处理

虚拟化RAN(vRAN)组件能够在一个计算平台上同时运行多个链路,践行更高效承诺。这些系统旨在实现长达十年的C-RAN目标,即保障规模经济性,使供应商更具灵活性,以及通过软件集中管理多链路和拥堵流量。我们知道如何在大型通用CPU上虚拟化作业,因此满足这种需求的解决方案似乎是不言自明的。这些平台也有缺点,即在无线技术核心进行信号处理时,价格高昂、能耗过高且效率低下。

嵌入式DSP搭配大矢量处理器,专为满足信号处理任务(如波束成形)的速度和低功耗而设计,但过去不支持在多个任务之间进行动态工作负载共享。扩大容量需要添加更多内核,有时需要添加较大的内核集群,或者最好通过预设的内核分区以静态形式共享。

▲动态矢量线程

矢量处理一直处于瓶颈,因为矢量计算单元(VCU)占用矢量DSP中的大部分区域。尽可能高效地使用该资源对于实现虚拟化RAN容量最大化至关重要。将内核数量加倍以处理两个通道的默认方法要求每个通道使用单独 VCU。

但在任何情况下,一个通道中的软件都可能需要矢量算术运算的支持,而另一个通道可能正在运行标量操作;在这两个周期中,其中一个VCU处于空闲状态。换个思路,假设一个VCU同时为两个通道提供服务,并使用两种矢量算术运算和矢量寄存器文件。

仲裁器可根据通道需求动态决定如何以最佳方式使用这些资源。如果两个通道在同一周期中都需要矢量算法,则这些通道将被定向至相应的矢量ALU和矢量寄存器文件。如果只有一个通道需要矢量支持,则可以跨两个矢量单位进行条带化计算,加速计算过程。这种在两个独立任务之间管理矢量操作的方法与执行线程非常相似,最大程度地利用固定计算资源同时处理一个或多个任务。

此技术便是动态矢量线程(DVT),会将每个周期的矢量操作分配给一个或两个高速算术单元(在此示例中)。您可以试想,将这一概念扩展到更多线程中,甚至可以进一步优化可变通道负载中的VCU利用率,因为独立线程中的矢量操作通常不同步。

支持DVT需要对传统矢量处理进行多个扩展。操作必须由广泛的矢量算术单元执行,才能允许每个周期进行 128次或更多MAC操作。VCU还必须为每个线程提供矢量寄存器文件,才能单独存储各线程的矢量寄存器内容。矢量仲裁单元通过线程之间的竞争有效地安排矢量操作。

此功能如何支持虚拟化RAN?在绝对峰值负载下,此类平台上的信号处理要求将会继续得到如期的满足,因为它们位于双核DSP上(每个都具有单独的VCU)。 

当一个信道需要矢量算术运算,而另一个信道在标量处理中处于静止状态或被占用时,第一个信道通过使用全向量容量可以更快地完成矢量循环。与两个DSP内核相比,这样占用的空间更小,提供的平均吞吐量更高。

更高的波束成形和固定无线接入效率

另一个关于DVT如何在基带处理中支持更高效率的示例可在5G-Advanced RRU中了解。

这些设备必须支持大规模MIMO处理以促进波束成形。大型MIMO RRU预计将支持多达128个有源天线单元,包括对多用户和运营商提供支持。这意味着无线电设备具有大量计算要求,并在使用DVT时效率更高。在支持固定无线接入的 UE、终端和CPE中,运营商聚合还可受益于DVT。DVT对蜂窝网络、基础设施和UE终端都大有裨益。

虚拟化RAN需要具有动态矢量线程的DSP

尽管人们倾向将大型通用处理器视为满足这些虚拟化需求的正解,但在信号处理路径中,这样的做法代表着倒退。我们不能忘记,基础设施设备制造商有充分的理由改用带有嵌入式DSP的ASIC。处理器价格昂贵、耗电且无法正确处理信号。富有竞争力的固定无线接入解决方案需要继续利用基于ASIC的DSP的优势,同时还需要利用对动态矢量线程的支持。

责编: 爱集微
来源:CEVA #CEVA#
THE END
关闭
加载

PDF 加载中...