对话地平线CTO黄畅:坚守技术初心,创新砥砺前行,解码地平线规模交付背后

来源:爱集微 #地平线# #车规AI芯片# #智能架构#
2.1w

集微网报道,车规大算力芯片的竞争日趋白热化,但“唯算力论”的怪圈正在被打破。近几年,伴随ADAS加速渗透,高阶自动驾驶兴起,以及软件定义汽车的逐步深入,智能汽车对于AI芯片算力的需求暴增,几百TOPS甚至上千TOPS,但业界也逐渐理性地认识到:算力有多重要,它就有多昂贵;而且,唯算力马首是瞻,仅靠堆叠芯片并不能堆出自动驾驶。

地平线联合创始人兼CTO黄畅近日在接受集微网的采访时表示:“随着AI算法演进,对于过去的硬件计算架构提出更高要求,发起更大挑战。新算法用于过去的硬件计算架构,即使堆再多的理论峰值算力,可能它的利用率也是极低的,低到百分之几甚至1%。这是一个很恐怖的数字,它会使得公司在硬件、工况上的投入相当低效。”

地平线联合创始人兼CTO黄畅

那么,AI算法会如何演进?怎样的计算架构才能匹配自动驾驶发展所需?好的车载AI芯片究竟应该具备哪些条件?新的计算架构下,又如何深度挖掘AI芯片的潜力,以更好地赋能车厂、Tier 1开发自己的自驾驶系统?对于以上这些问题,黄畅都作了深度分享。而且,地平线从成立之初,就一直在探索这些根本的技术问题,并提出了很多创新的,甚至在当时看来反共识的技术理念和商业模式,“实践出真知”,这些理念和模式正在为更多的开发者所接受,因此我们看到,地平线凭借这些核心能力,进击突围,获得了越来越多的车企定点和生态合作,正与英伟达、Mobileye等国际巨头比肩竞争。

洞察AI算法趋势,提出“智能计算架构2.0”

过去十年里,AI算法迭代速度加快,各个领域的AI算法大约平均每9-14个月达成相同精度条件下计算次数下降一半。其实,从国际棋坛的动态能清晰看出,AI算法已经发生了颠覆式的“质变”。

20多年前,IBM的“深蓝”战胜卡斯帕罗夫,整个行业惊叹,哪怕是世界冠军也会被这样的极致的AI系统所击败,同时感慨无论AI怎么发展,人类在围棋上都不可击败。但仅仅过了20年,谷歌的AlphaGo更是以一种碾压式的方式击败了曾经被视为是人类的智慧巅峰的九段棋手李世石、柯洁。

黄畅认为,过去二三十年间,尤其是过去十年里,AI算法已经从传统基于知识、规则、经验的专家系统迁移到了机器学习,尤其是以深度学习为代表的大计算量、大数据量的AI计算。

而智能汽车堪比“计算机诞生”级的颠覆式创新,正在成为人类科技发展的母生态。现阶段,整个汽车行业、市场也出现了很多新的趋势,一方面,中国已经成为了全球顶级汽车智能芯片的“角斗场”,英伟达、高通、地平线等最新产品都选择在国产车型上首发,这说明中国智能汽车拥有很好的发展土壤。

另一方面,自动驾驶在不断量产落地的过程中,对算力的需求持续提升,最新旗舰车型都已经采用了上百TOPS算力的芯片。同时,伴随功能和场景不断丰富,搭载的传感器数量显著增加,自动驾驶对于计算的需求也在大幅提升,大规模并行运算的AI计算形成了新趋势。更重要的是,AI计算取代了逻辑计算,成为了车载计算的核心,AI芯片的重要性凸显。

AI算法近些年的进化也极大推动了汽车智能化的发展,自动驾驶行业已出现了数据驱动为主的发展趋势,替代了传统基于规则的计算。例如,以整个自动驾驶处理的流程来看,主要有感知-地图融合-规划-控制四个阶段,它形成了机器人的基本处理链路。

这一处理链路中,从前到后数据驱动的程度不断加深,将越来越摆脱对于规则的依赖。这还进一步带来一个好处:不仅仅是数据驱动加深,在端到端上也实现了越来越多的融合。现阶段,感知和地图融合已经构成一个端到端的系统,越来越多融合成一个“大感知”模块,而规划、控制也有同样的趋势,逐步形成“大规控”的模快。

此外,行业已达成共识,将从现阶段智能驾驶与智能座舱分开的域控制器,最终会走向一个中央的计算平台,由AI中台去完成包括驾驶、交互等方方面面的智能计算,而传统的像IVI和控制方面的部分主要做一个子系统辅助AI中台完成一些基本的传统功能。

黄畅表示,“这些趋势使得我们重新思考,自动驾驶的新技术范式要与之相匹配一个全新的计算架构,这个计算架构使得整个机器更加自主,使得开发更加简单,让计算更智能。”

由此,地平线提出“智能计算架构2.0”概念。

黄畅认为,智能计算的1.0时代是基于CPU,基于规则实现通用计算,用逻辑驱动的方式进行编程。而智能计算架构的2.0时代,则通过端云数据不断的聚合,并且化繁为简的开发范式和算法,以及软硬结合的计算架构的不断迭代,这是典型的数据驱动,尤其以深度学习、增强学习为代表的全新计算架构的衍生。

挖掘AI芯片性能,实现系统效率持续引领

在智能计算架构2.0时代,芯片也将会发生明显变化,未来将会形成一个统一的计算架构,可以满足智能汽车的各种应用需求。具体到芯片上,黄畅认为,未来一颗芯片除了必须的输入输出I/O之外,百分之95%以上的面积与功耗都将会为通用神经计算服务,只有不超过5%的区域为专用指令服务,为特定领域的应用、算法去做服务。

黄畅表示,智能计算架构2.0将会与它支撑的软件、硬件的计算架构相结合,从而加速实现机器的自编程和应用的自适应。

“智能计算架构2.0”概念,其实也可以看作,地平线在成立初期提出的“AI计算的新摩尔定律”这一理念的延续。在经典摩尔定律时代,行业用“PPA”(即Power、Performance、Area)指标来衡量一颗芯片的性能。而在AI芯片时代,需要新的范式来定义性能,即新摩尔定律,主要从单位成本下峰值算力(TOPS/$)、峰值算力的有效利用率(TOPS/Watt),以及有效算力转化为AI性能的比率(FPS/TOPS)三大维度来衡量真实的AI效能。目前,这一理念已逐渐成为业界共识。

后摩尔时代,计算性能的提升在于软件工程、算法、硬件架构联合优化。2年前,Science杂志上有一篇文章认为,即便是传统半导体的摩尔定律已经陷入迟滞的状态,实际上它的顶层,通过软件、算法、硬件架构的设计,还可以持续推进端到端整体的计算架构、计算效率持续往前演进。这一想法也与地平线不谋而合。

如何继续推进?黄畅认为,必须为这样一个复杂的,要考虑算法架构、软件架构和硬件架构去构建一套高效的端到端的AI计算架构仿真平台,包含算法、编译器和计算核或者SoC的整个架构,并关注算法、软件和硬件架构往前演进。

黄畅表示,地平线在过去几年里做了很多探索,在做网络结构设计时充分考虑硬件架构,并且将编译器的自动优化也结合在一起,从而去探索得到最适合硬件计算平台的一个算法架构。

例如,地平线在征程5芯片上加载了第三代的处理器架构贝叶斯,它聚焦了最新的神经网络架构设计,能满足自动驾驶场景需求,它本身的近存计算体系、脉动张量阵列、大并发的数据桥,使得它有很好的计算密度和能效。

同时,地平线通过软硬协同的编译优化释放系统最优性能,既有比较经典的数据级别的拆分、并行,也有计算的重整,以及深度学习里很关键的一个操作——就是将更多的算子集中在一起进行高效的计算,它带来的好处可以充分发挥近存计算的优势,减少数据搬迁带来的功耗和成本。

值得一提的是,征程5刚发布时极致计算性能为1283FPS,但在过去一年实际提升了20%到1531FPS。那么,这是如何实现的?对此,黄畅表示,“征程5的芯片没有变,算法没有变,地平线仅仅是通过编译器优化调度、软件架构上的演进,使得我们可以有持续的提升动力,而且还会持续有进一步提升。”

黄畅也指出,现阶段而言,软件、硬件、算法这三个不同架构的设计方法论上有代差。例如,算法的设计现在已经开始越来越多地走向基于数据驱动的自动化,典型的就是NAS(Network Architecture Search),而且NAS从早期的纯粹关注计算和存储、带宽,越来越多走向了跟硬件架构紧密配合在一起去思考什么样是一个最优的算法架构的阶段。

软件架构方面,典型的编译器、调度过程也已经在基于规则的自动化路上走得很远,地平线现在也在推进关于编译器软件架构设计上,基于数据驱动的自动化设计。

硬件架构层面,尤其是顶层的硬件架构设计,目前大量还是基于人的手工设计辅以一定的基于规则的自动化的方法。

但地平线相信,最终所有的端到端的架构设计都会走向基于数据的自动化设计,无论关于每个架构的效果评估还是架构的持续迭代,最终都会从规则走向基于神经网络的,数据驱动的方式,就像前文所提及的围棋领域的AI计算变革所达成的结果一样。

赋能行业开发者,打造更加开放的生态

最终,地平线思考的一直是,如何将软硬件结合在一起,去构建更高效的智能计算架构,从而更好地去服务未来整个AI算法的发展趋势,实现系统效率持续引领,赋能AI高效开发。

对自动驾驶而言,地平线要做的也是从实际应用场景出发,“以终为始”,做“好且好用”的智能计算平台,帮助更多的行业开发者快速实现智能驾驶应用落地。

黄畅表示,算法本质上是一个行业发展的客观趋势,地平线基于强大的算法团队,有更好的前瞻的预判能力。基于此,地平线可以更早地把前瞻的算法趋势判断带入到当前一代的软硬件计算架构的设计中。我们知道,芯片研发的周期较长,软硬件的计算架构设计成为一个芯片,以及打磨支持其应用开发的工具链、操作系统,需要两年、三年甚至更长时间,前瞻的算法趋势预判能力可以使计算平台落地时仍然能够满足最时新的算法需求,并不过时。

对于自身的定位,地平线定位于Tier 2,车企或Tier 1可以直接选购也可以按需选购,从BPU架构、芯片、操作系统、自动驾驶软件算法,从底层逻辑到顶层决策都有不同层次的开放合作模式,请车企、Tier1等广泛的行业伙伴共同参与,掌握创新的主动性和领先性。

黄畅解释道,确实,地平线可以做端到端的技术,但是做自动驾驶方案的主要目的是充分验证每一代的计算平台,即芯片和开发软件平台的有效性、可用性,并且加速它推动商业化落地,同时指导我们更好去构建下一代的计算平台,使得计算平台更加高效易用,能够赋能更多的开发者在上面开发。

地平线曾把芯片公司与车企的合作模式,进行了总结:第一种是Mobileye模式,Mobileye把芯片架构、芯片以及操作系统,还有智能驾驶的软硬件系统,全部开发完了以后交付给车企,即黑盒系统;第二种是英伟达模式,英伟达把GPU架构开发成芯片,然后包上自己的操作系统CUDA, 再去让业界开发自动驾驶的软硬件系统;第三种是地平线提出的TogetherOS 模式,把BPU跟SoC开发完了以后,中间的底层软件通过开源OS开放的模式跟整车一起系统开发;第四种也是地平线的BPU授权模式。BPU授权模式对主机厂来说意味着整车开发可以完全从芯片到操作系统、到整个自动驾驶的软硬件系统,实现高度的协同,完全的透明。

一切的价值创造都源于持续的技术突破。地平线认为,保持高效是在智能汽车时代,打造开放创新生态的重要意义。

得益于技术积累和开放的生态,地平线在自动驾驶领域已成功破局,目前已经跟20多家车企定点合作,有70多个车型前装定点,上百万的车规芯片出货,有超过100家生态合作伙伴。而且,地平线还在持续探索和努力,这对于智能汽车创新生态的发展,将是非常重要的推动。黄畅表示:“我们现在的开放性更多体现在面向软件开发者的算法和方案的开放、工具的开放。我们还在持续努力,围绕软件开发、硬件的设计开发,尤其是芯片级的硬件设计开发,进一步提高开放性,这是我们正在努力的方向。”

而且,智能汽车是自主机器人的第一形态,未来,地平线在智能汽车这个行业所开发的技术、平台、产品会大量外溢,去赋能各个行业。正如地平线的公司使命,“赋能机器,让人类生活更安全,更美好。”(校对/萨米)

责编: 张轶群
来源:爱集微 #地平线# #车规AI芯片# #智能架构#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...