动态可重构技术打造更灵活的芯片(下)
通过工具进行设计
与富士施乐公司不同,另外一些芯片厂商则希望无需手动设计电路结构的切换方式,而是将其交由软件工具完成,以缩短开发周期,如NEC电子于2002年推出的STP引擎。目前NEC电子的STP引擎技术已应用于索尼的播放器设备中。索尼共有3款设备采用了同样的芯片,在随后上市的产品中,也并未更改芯片的掩膜,只是增加了图像处理功能等。
如果像索尼这样,在多款设备中采用同样的芯片,并通过软件来增加新功能,那么就无需使用任何动态可重构技术,直接采用普通的FPGA即可实现。而且,最新的FPGA也已经可以在数十毫秒内动态地改变电路结构。
不过,对于各种媒体处理任务来说,动态可重构技术与FPGA相比具有明显的优势。动态可重构芯片的单元粒度比FPGA粗,因此面积效率较高。FPGA 的处理单元是查找表(LUT),以门为单位,粒度极小;而大多数动态可重构芯片的粒度较粗,以ALU为单位,粒度达8位~32位(见图2)。当单元粒度较粗时,单位面积内的单元数就较少,布线与开关等外围电路所占的面积也较小,面积效率自然得以提高。据庆应义塾大学理工学院信息工程系教授天野英晴称:“如果要在电路中实现普通的媒体处理功能,那么使用动态可重构技术时的面积效率大约是FPGA的5倍~10倍。”
继续改善架构 减少布线数量
目前已进入实用化阶段的动态可重构技术大多基于IPFl e x、N E C电子等厂商在2 0 0 0 年前后所开发的基础技术。受这些基本架构的影响,很多企业在2004年左右也开始着手自行开发相关技术,这些企业包括东芝、三洋电机、日立制作所、三菱电机、瑞萨科技等(见表1)。

表1 日本厂商所开发的动态可重构技术
这些公司的动态可重构技术大多尚未应用到实际产品中,仍处在研发阶段。不过,这些技术都是以IPFlex、NEC电子等开发的基础技术为参考,再设法进行改善。具体来说,是考虑如何减少单元间的布线,削减冗余面积和电路面积。东芝研究开发中心计算机网络拓扑研究主管、动态可重构技术FlexSword 的开发者吉川宜史就认为:“对于消费类设备来说,现有的动态可重构技术中单元之间的布线还是过多。”
在东芝的FlexSword技术里,ALU矩阵规模较小,仅8路×5级,ALU之间的连接只有上下方向(见图3)。图3中的蓝色虚线显示出数据的流向,数据先进入ALU矩阵完成SIMD(单指令多数据流)所不擅长的处理,然后再通过SIMD运算单元进行特定的媒体处理。而且,FlexSword技术中不是简单的连接邻近单元,而是依次连接1个、2个、4个邻近单元。吉川宜史表示:“对于媒体处理的蝶形运算那样一边载入数据一边进行处理的方式,这种连接的效率最高。”

图3 将ALU矩阵与SIMD结合在一起的FlexSword技术
三洋电机开发的动态可重构技术的内部结构与东芝的Fl e xSwo r d技术较为类似。其将24位的ALU排列成6路×4级的矩阵,每个ALU只与下一级的3个ALU相连接(见图4)。该技术主要用于车载调谐器的基带处理。三洋电机研究开发本部数字技术研究所系统设计研究部科长平松达夫介绍说:“如果要用于消费类设备,那么必须实现更小的电路面积,因此需要减少布线的连接端,使布线的总长度和电路规模均得以减小,这样还有利于提高速度。”

图4 三洋电机车载调谐器
ALU阵列以外的电路也可以动态重构
通常说的动态可重构技术大都是指ALU的矩阵排列以及媒体处理和通信处理的优化等。但最近业界又提出了一种完全不同的动态可重构技术,其中排列的单元并不是ALU。虽然其内部架构与ALU矩阵架构完全不同,但其目的都是通过切换电路结构来实现动态可重构,以削减电路面积,提高编程灵活性。
例如,三菱电机面向MPEG-2及H.264等熵编码VLC/D(可变长编/解码)处理开发了全新的动态可重构技术。该技术给数据流中出现频率较高的数据分配一个较短的霍夫曼编码,然后尽可能将这些编码集成到有限的电路面积上。各单元由4位寄存器与比较器组成,霍夫曼编码表的查询处理其实是通过多个单元并行执行位列的模式匹配(见图5)。在该应用中,各单元的处理只有位列的简单比较,如果采用粗粒度的ALU矩阵来实现就会太过浪费。

图5 H.264/MPEG-2等VLC/D处理的动态可重构技术
VLC/D处理通用于MPEG-2及H.264等,但表的查询方式不同。在MPEG-2里,只使用单一的固定表;而H.264及MPEG-4里,数据流的内容需针对每一帧图像分别使用多种不同的表。为了支持多种标准,并将每个标准的优化特性集成到逻辑电路上,就需要进行动态可重构。(全文完记者:进藤智则)
与富士施乐公司不同,另外一些芯片厂商则希望无需手动设计电路结构的切换方式,而是将其交由软件工具完成,以缩短开发周期,如NEC电子于2002年推出的STP引擎。目前NEC电子的STP引擎技术已应用于索尼的播放器设备中。索尼共有3款设备采用了同样的芯片,在随后上市的产品中,也并未更改芯片的掩膜,只是增加了图像处理功能等。
如果像索尼这样,在多款设备中采用同样的芯片,并通过软件来增加新功能,那么就无需使用任何动态可重构技术,直接采用普通的FPGA即可实现。而且,最新的FPGA也已经可以在数十毫秒内动态地改变电路结构。
不过,对于各种媒体处理任务来说,动态可重构技术与FPGA相比具有明显的优势。动态可重构芯片的单元粒度比FPGA粗,因此面积效率较高。FPGA 的处理单元是查找表(LUT),以门为单位,粒度极小;而大多数动态可重构芯片的粒度较粗,以ALU为单位,粒度达8位~32位(见图2)。当单元粒度较粗时,单位面积内的单元数就较少,布线与开关等外围电路所占的面积也较小,面积效率自然得以提高。据庆应义塾大学理工学院信息工程系教授天野英晴称:“如果要在电路中实现普通的媒体处理功能,那么使用动态可重构技术时的面积效率大约是FPGA的5倍~10倍。”
继续改善架构 减少布线数量
目前已进入实用化阶段的动态可重构技术大多基于IPFl e x、N E C电子等厂商在2 0 0 0 年前后所开发的基础技术。受这些基本架构的影响,很多企业在2004年左右也开始着手自行开发相关技术,这些企业包括东芝、三洋电机、日立制作所、三菱电机、瑞萨科技等(见表1)。

表1 日本厂商所开发的动态可重构技术
这些公司的动态可重构技术大多尚未应用到实际产品中,仍处在研发阶段。不过,这些技术都是以IPFlex、NEC电子等开发的基础技术为参考,再设法进行改善。具体来说,是考虑如何减少单元间的布线,削减冗余面积和电路面积。东芝研究开发中心计算机网络拓扑研究主管、动态可重构技术FlexSword 的开发者吉川宜史就认为:“对于消费类设备来说,现有的动态可重构技术中单元之间的布线还是过多。”
在东芝的FlexSword技术里,ALU矩阵规模较小,仅8路×5级,ALU之间的连接只有上下方向(见图3)。图3中的蓝色虚线显示出数据的流向,数据先进入ALU矩阵完成SIMD(单指令多数据流)所不擅长的处理,然后再通过SIMD运算单元进行特定的媒体处理。而且,FlexSword技术中不是简单的连接邻近单元,而是依次连接1个、2个、4个邻近单元。吉川宜史表示:“对于媒体处理的蝶形运算那样一边载入数据一边进行处理的方式,这种连接的效率最高。”

图3 将ALU矩阵与SIMD结合在一起的FlexSword技术
三洋电机开发的动态可重构技术的内部结构与东芝的Fl e xSwo r d技术较为类似。其将24位的ALU排列成6路×4级的矩阵,每个ALU只与下一级的3个ALU相连接(见图4)。该技术主要用于车载调谐器的基带处理。三洋电机研究开发本部数字技术研究所系统设计研究部科长平松达夫介绍说:“如果要用于消费类设备,那么必须实现更小的电路面积,因此需要减少布线的连接端,使布线的总长度和电路规模均得以减小,这样还有利于提高速度。”

图4 三洋电机车载调谐器
ALU阵列以外的电路也可以动态重构
通常说的动态可重构技术大都是指ALU的矩阵排列以及媒体处理和通信处理的优化等。但最近业界又提出了一种完全不同的动态可重构技术,其中排列的单元并不是ALU。虽然其内部架构与ALU矩阵架构完全不同,但其目的都是通过切换电路结构来实现动态可重构,以削减电路面积,提高编程灵活性。
例如,三菱电机面向MPEG-2及H.264等熵编码VLC/D(可变长编/解码)处理开发了全新的动态可重构技术。该技术给数据流中出现频率较高的数据分配一个较短的霍夫曼编码,然后尽可能将这些编码集成到有限的电路面积上。各单元由4位寄存器与比较器组成,霍夫曼编码表的查询处理其实是通过多个单元并行执行位列的模式匹配(见图5)。在该应用中,各单元的处理只有位列的简单比较,如果采用粗粒度的ALU矩阵来实现就会太过浪费。

图5 H.264/MPEG-2等VLC/D处理的动态可重构技术
VLC/D处理通用于MPEG-2及H.264等,但表的查询方式不同。在MPEG-2里,只使用单一的固定表;而H.264及MPEG-4里,数据流的内容需针对每一帧图像分别使用多种不同的表。为了支持多种标准,并将每个标准的优化特性集成到逻辑电路上,就需要进行动态可重构。(全文完记者:进藤智则)
|
|
|
|
