芯历史──纵览国内外半导体产业发展历程,挖掘行业奇闻趣事,以古鉴今,探寻产业未来发展之道。
在半导体领域,只有GPU能以2倍于摩尔定律的速度发展,能在PC领域挑战同时期CPU的地位,以及能让图形业界的创作者和无数游戏玩家为之“疯狂”。正式诞生二十余年来,GPU已经从简单的可编程几何处理器发展成当前可以多千兆赫速度运行的64位浮点处理器,且应用范围逐步拓展至超算、人工智能、边缘计算、医疗仪器、汽车和移动设备等众多领域。时代浪潮汹涌、技术演进日新月异,通过回顾GPU行业的发展和竞逐历程,可以深刻体会它从萌生到壮大的前因后果和重要启示。
01草莽时代:Pre GPU群英“百家争鸣”
追溯GPU的历史,要从草莽时代的图形显示控制器说起。早在1962年,麻省理工学院的博士伊凡•苏泽兰发表的论文,以及他的画板程序就初步奠定了计算机图形学的基础。在随后近20年时间里,计算机图形学获得持续发展,但未取得实质性重大突破。由于对计算能力、精度、运行强度和硬件等要求极高,计算机并没有配备专门的图形处理芯片,均使用CPU来完成图形处理任务。当时,显卡的作用仅是实现图形显示,即将CPU计算生成的图形“翻译”成显示设备可以识别的信号,并不具备计算能力。
然而,随着图形计算技术不断演进,上世纪80年代早期出现的Commodore Amiga创造性地将一些图像产生功能加入显卡,包括线段绘画、区域填充和块图像传输等。1981年,IBM公司发布世界上第一台个人电脑IBM5150,便搭载了黑白显示适配器(MDA)和彩色图形适配器(CGA)。这就是最早的图形显示控制器。1987年,IBM又推出EGA,并提出了至今仍在兼容使用的VGA标准。这一标准在文字模式下可支持720×400分辨率,绘图模式下可支持640×480×16色等输出,奠定了图形显示的早期标准。
但受软硬件、技术障碍和成本等因素限制,图形处理依然未被普遍加入显卡中。直到90年代初,在微软Windows系统的推动下,显示芯片厂商才开始在产品中加入一定的图形运算功能,以减轻CPU的负担。其中,1991年S3 Graphics推出的“S3 86C911”,因能进行字符、基本2D图形和矩形绘制,正式开启了2D图形硬件加速时代。此后,随着2D加速迅速普及,1995年几乎所有的显卡都已具备这一功能,并开始配备较高容量和性能的显存。同时,2D图形接口GDI、DirectFB等也都相继出现,且相关标准至今仍在沿用。
不过,由于技术标准及迭代已不能满足行业发展需求,2D图形加速卡很快盛极而衰。例如索尼PS等游戏机上已率先出现3D游戏,并吸引了大量用户。由此,1994年3DLabs更进一步发布了第一颗用于PC的3D图形加速芯片Glint 300SX,支持高氏着色、深度缓冲、抗锯齿和Alpha混合等特性,开启了显卡3D加速时代。紧随其后,众多图形厂商纷纷推出3D加速显示卡,包括英伟达的NV1、S3的Virge3D、PowerVR的PCX1等。不过,这一阶段的显卡大多还没有执行统一的程序接口(API)标准,加速功能也不尽相同。
ATI 3D Rage Pro 图源:Techspot
面对这一行业发展痛点,微软推出的Direct3D和OpenGL等通用API开始被普遍采用,使接口难题得到了有效解决。与此同时,为了应对3D图形处理中的架构难题,“渲染管线”的概念开始出现,使多边形转换与光源处理等功能也开始被加入到显卡中。而这也为消费市场发展打开了空间。1995年,3DFX发布消费领域史上第一款3D图形加速卡Voodoo,英伟达和ATI也迅速跟进发布TNT系列与Rage系列显卡。这些产品已从硬件上实现Z缓存和双缓存,可以进行光栅化等操作,使CPU终于从繁重的像素填充任务中得以解脱。
不过,这些产品技术仍是算不上成熟,如顶点变换还是必须在CPU中完成,光栅化后的像素操作也有限。到了1999年,随着显卡处理能力快速提升,英伟达在推出GeForce 256芯片时,正式提出了GPU这一概念。GeForce 256整合了关键的硬件变换和光照(T&L)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等功能,并且兼容DirectX和OpenGL,被称为世界上第一款GPU。在作用上,GeForce 256将显示核心与CPU并列,成为计算机内两大运算核心,大大减少了对CPU的依赖。
不难发现,GPU概念诞生之前的近20年时间,“Pre GPU”时期的技术路线从图形显示、2D加速、3D加速逐步迭代至固定管线。同时,在这一革新进程中,S3、ATI、AMD、英伟达、3DFX等众多大小玩家展开激烈竞争,一度形成“百家争鸣”局面,共同推动了图形处理芯片的快速迭代和演进,并为行业后续发展奠定了基础。比如顶点着色器和像素着色器的引入让GPU的可编程性大大提升,并在后来促成GPU的代际革命。而英伟达推出的GPU可谓多种架构路线关键技术的集大成者,因此得以在竞争厮杀中脱颖而出、扶摇直上。
02黄金时代:英伟达、ATI“双雄争霸”
千禧年之际,随着计算机行业飞速发展以及各GPU技术日趋成熟,图形计算首次进入“黄金时代”,同时各路玩家的激烈竞争也促使市场格局数次重塑。其中,通过推出消费级Voodoo 3D加速卡,3DFX曾引领GPU市场。而由于蔑视主流标准,英伟达采用自创四边形成像(QTM)技术打造的NV1和NV2都未成功。但英伟达再接再厉,又陆续推出RIVA、TNT系列和GeForce 256等产品,最终击败3DFX占据市场主流地位,并于2000年将其知识产权买断。巨头较量、小兵遭殃,一些中小厂商无力应对行业竞争,选择淡出显卡市场。
经过这一轮行业大洗牌后,英伟达开始在GPU赛道崭露锋芒,而剩下的主要对手是ATI。为了抗衡英伟达,2000年ATI推出Radeon品牌,从而全新开启独立GPU领域的两强争霸。第二年,微软发布了包含全新Shader Model(优化渲染引擎模式)1.0标准的DirectX 8.0。由于遵循这一接口标准的GPU具备顶点和像素的可编程性,微软开始引领图形硬件标准,而T&L硬件则逐步被抛弃。为了抢占先机,英伟达迅速发布第一款支持DX8.0的GeForce 3。但ATI毫不示弱,随后立即推出了第一款支持DX8.1的Radeon 8500“分庭抗礼”。
可以说,在微软DX接口标准的助攻下,当时英伟达、ATI的竞争极具开创意义。因为这一时期确立的GPU编程思路一直延续至今,不但深入到工程领域改善了人们的日常生活,而且开创了诸多计算机科学的新领域,如光照模拟、人体动画和通用计算等。不过,这一代GPU还没有实现支持像素级的编程能力,也就是片段编程能力,但市场力量的博弈很快又继续推动了相关技术演进。2002年,微软为了对抗索尼PS2降价销售Xbox,导致其芯片合作供应商英伟达对价格不满。随后,微软改选ATI作为下一代主机的GPU供应商。
为了反击ATI和微软,英伟达迅速推出了具有突破性和覆盖高中低端的GeForce 4系列产品,其中GeForce4 MX440在很长一段时间内都是低端显卡的性能标杆。但英伟达没料到的是,ATI不久后就祭出了“杀手锏”R300 GPU,具备领先英伟达同类产品接近一倍的性能。自此,ATI和猝不及防的英伟达开始平起平坐。而鉴于ATI带来的竞争压力,英伟达又快速开发出了其下一代产品:GeForce FX 5800Ultra。但由于太过仓促,不成熟的0.13微米工艺以及过高的功耗、发热和噪声等问题,导致这款GPU一度成为英伟达最失败的产品。
即便如此,在英伟达和ATI的激烈竞逐下,GPU的可编程性已经达到较高水平,进而促使行业革命的时机逐渐成熟。在SIGGRAPH 2003大会上,许多业界泰斗开始共同探讨利用GPU进行各种通用运算的设想和实验模型,从而为GPGPU的迅速落地发展奠定了基础。在随后3年时间里,用统一的通用流处理器取代GPU中原有的不同着色单元设计,大大释放了GPU计算能力,乃至成为现代的异构计算核心。其中,英伟达的GeForce FX系列和ATI Radeon 9700是通用GPU的先驱,并且都具有顶点编程和片段编程能力。
与此同时,2004年英伟达汲取以往教训推出全新的GeFroce 6800Ultra,并凭借优异的产品性能再次夺回GPU老大的地位。但值得注意,其中的重要原因还在于ATI同期推出的X800性能一流,却不支持最新的DX。这无异于“缺胳膊少腿”。此外,双方的较量还延伸至GPU架构上。2005年,ATI推出采用“统一渲染”架构的Xenos,并应用在与微软合作的游戏主机Xbox 360上。但英伟达随后发布的GeForce 8800 GTX才在行业产生真正影响力:不仅是第一款采用“统一渲染”架构的桌面GPU,更影响日后数代产品成为划时代的产品。
到了2006年,英伟达还把GeFroce7800GTX的核心频率提高25%,实现20%以上的性能提升。紧接着,ATI使用GDDR4显存推出DX9时代最强的单芯GPU—RadeonX1950XTX。然而,这也成为ATI GPU的最后辉煌。当年,为了整合CPU和GPU业务实现“双轴联动”,AMD斥资达54亿美元收购ATI。但完成收购后,AMD的重心很快转向中低端市场,致使产品性能逐渐落后英伟达。于是,英伟达牢牢掌控了GPU高端市场,而AMD的产品则一度成为性价比的代名词。经过数年激烈竞逐、你争我夺,GPU双雄就此“划江而治”。
03摩登时代:“双英”携AMD“三分天下”
近十五年来,随着半导体巨头在GPU领域投入的研发和资本等要素大大增加,行业开始出现“马太效应”,并建立起较高技术壁垒。自2006年起,英伟达的GPU架构基本每两年大更新一次,带来了更多优异的运算单元和API适配性,并逐步掌握更多高端显卡技术。此外,同年英伟达还推出了CUDA编程软件,使得GPU打破图形语言局限成为真正的并行数据处理超级加速器。而2011年Tesla GPU计算卡的发布,标志着英伟达将用于计算的GPU产品线正式独立出来,在通用计算及超级计算机领域逐渐取代CPU成为主角。
不过,英伟达的软硬件技术开发之路并不是一帆风顺。比如2010年,英伟达发布了全新的GPU架构Fermi及相关产品,但却再次出现功耗过高、发热量大等致命性问题。其中,以Fermi架构为核的GeForceGTX 480就因为巨大的功耗和发热量“闻名于世”,据说曾发生过有人用GTX 480来煮鸡蛋的事情。然而,技术研发和探索也常常“福祸相依”,英伟达在战略赛道和技术路线选择上也曾有光辉时刻。自2016年以来,其相继推出了内置150亿个晶体管的Tesla P100,以及加入Tensor单元的Tesla V100,从而助力人工智能时代加速到来。
此后,英伟达继续快马加鞭,针对不同领域推出了多款GPU核心架构,包括Pascal、Volta等。其中,2018年英伟达发布全新图灵(Turing)架构,以及支持光线追踪技术(RTX)的游戏和专业级显卡。这一架构被公司CEO黄仁勋称为近20年GPU的最大革新,关键特点就是加入了光线追踪技术。2020年,针对人工智能、高性能计算和大数据等领域,英伟达顺势而为,再次推出性能优异的安培(Ampere)架构。如今,经过多年耕耘积累,英伟达已针对各领域打造了几大核心产品线,包括GeForce、Quadro、Tesla和Tegra等。
英伟达GeForce GTX 1060 (左) 和AMD Radeon RX 580 (右)
作为英伟达的主要竞争对手,AMD曾在吃下ATI时背负巨额债款,因而身陷囹圄。而由于在CPU和GPU两条线上分别面临不同强敌竞争,AMD便遭遇了遭遇巨大的困境和挑战。鉴于此,英伟达甚至一度减慢了产品升级速度,比如2008年发布的9800GTX相较上一代产品并没有实质性性能提升。趁此机会,AMD当年推出了高性能RV770,成为其极富竞争力的GPU产品,而主打性价比的HD4850迫使英伟达GeForce 9800GTX一夜之间降价千元。但不久后,在英伟达覆盖高中低端的多维打压、持续冲击下, AMD又再次跌落低谷。
后来多年,AMD在与英伟达的竞争中持续处于下风。直到2019年前后,凭借RDNA架构显卡的成功试水和先进工艺等方面实现重大突破,AMD才实现业绩连续飘红、市值大涨。第二年,AMD趁热打铁,除了发布Ryzen 5000系列CPU,还推出再次震惊业界的Radeon 6000系列GPU,在性能一定程度追平了与英伟达多年的差距,再次成为行业翘楚。自此,作为“全球唯一能同时提供高性能GPU、CPU以及独立GPU和集成GPU的半导体企业”,AMD逐步实现了引领行业的一些技术迭代,进而使得早期的“双轴联动”梦如愿以偿。
另外,作为多年来全球最大半导体厂商,英特尔也一直对独立GPU跃跃欲试、百折不挠。其实,英特尔入局GPU最早可以追溯到1998年的i740,但由于羸弱的性能和缓慢的更新速度,一直没有非常大的起色。进入酷睿i时代后,英特尔通过将核芯显卡和CPU进行捆绑销售,利用CPU的庞大市场份额,确立了在集成GPU领域的垄断地位。与此同时,尽管由于战略投入举棋不定等因素数次失败,英特尔也一直没有放弃开发独立GPU。比如,2020年英特尔就在其架构日中再次推出Xe GPU架构,以向高性能独立显卡领域扩张。
当前,在各大行业巨头激烈竞逐下,全球GPU已进入技术演进的“摩登时代”和寡头垄断的市场格局。在传统GPU市场中,英伟达、AMD、英特尔的营收几乎可以代表整个行业的收入。其中,独立显卡领域主要由英伟达和AMD控制,而集成显卡领域由英特尔和AMD掌控。就整个市场而言,根据调研机构JPR的数据,2021年英特尔在核心GPU的市场份额为68%,英伟达和AMD为15%上下。但值得注意的是,在强力政策和市场的推动下,中国GPU企业正蓬勃发展,同时在软硬件方面出击,未来或在全球市场占据一席之地。
结语
总体而言,近三四十年来,全球GPU技术路线已从早期的图形显示、2D加速、3D加速逐步迭代至固定管线、统一渲染、通用计算,同时市场格局也依次从百家争鸣演变至双雄争霸和三分天下。如今,随着大数据和人工智能时代来临,人类需要处理的数据、图形和信息量等呈几何级增长,但半导体工艺微缩已趋于物理极限,性能精进面临瓶颈。为了应对行业这些新局面和海量需求,GPU正在越来越多的高新科技领域发挥重大作用。至于未来,GPU的角色还将如何扮演,以及相关技术和市场格局又将如何演变,且拭目以待。(校对/隐德来希)