美剧《硅谷》的梦想,正在一家中国科技公司变成现实

来源:爱集微 #DataBox#
3.8w

大道至简,大巧不工。最根本最具价值的问题,往往朴素平凡。

袁隆平,毕生研究一个问题——水稻产量。这是伴随人类几千年的古老问题,不新奇,不性感;就连高考招生,都难找到自愿选择研究这个古老问题的年轻人。尽管,谁都明白一个简单的道理——每亩水稻单产哪怕只提高10%,都意味着同样的地球资源可以多养活10%的人口,价值难以估量。

那么,这个众所周知也是极具价值的问题,为什么偏偏难以吸引众人的兴趣呢?原因同样可以理解,一个字,难。既然是研究了几千年的重要问题,要是有什么容易想到的好方法好技术,只怕早已被人研究过了,投资过了,轮不到自己吧?不看也罢,还是看看新东西,大概更有机会。趋利避害,畏难取巧,在商业的世界里也不妨称为理性,代表人群中99%的主流思维逻辑。

然而,世界往往恰是由并非如此这般理性的那1%人群推动的。SpaceX这种常人不敢、不信、不肯、不能做的重大科技创新,如果没有其创始人和放弃其它选择投身其中的精英人才,可能很长时间内都不会有其他人敢于、能够做这些事情。所以,是Elon Musk们,是特斯拉们,是爱因斯坦们,才真正改变了世界。

HBO美剧《硅谷》截图

先后播出六季的HBO高分人气美剧《硅谷》,演绎的正是这样一个大巧不工改变世界的IT创业故事。主人公Richard,木讷腼腆,拙于言谈,单身宅男一枚;做起计算机技术来,却是一位奇思妙想脑洞大开不走寻常路的科技达人。他的创业项目PiedPiper不是什么追风新潮的热门概念,而是埋头突破了一个无人问津的古老经典问题——数据压缩。数据压缩比例哪怕只提高10%,就意味着整个人类数字世界的存储、传输成本降低10%。这是与水稻单产提高10%类似的基础技术进步。正是凭借数据压缩技术的突破,PiedPiper先后突破了存储、VR、视频等一系列想象空间巨大的下游产业,并最终催生了革命性的去中心化新一代互联网。

美剧《硅谷》赢得了高分人气,而现实中的IT产业在观剧调侃之余,依旧波澜不兴。究其原因,数据压缩技术的价值毋庸赘言,然而说起来容易,做起来难。全球芯片产业巨头Intel推出了数据压缩功能芯片,国内IT产业排头兵华为研制了数据压缩功能芯片并作为大数据、存储领域的服务器整机产品亮点技术隆重推出,世界电子产业领头羊三星在SSD产品中集成了数据压缩功能芯片……甚至,就连上述产业巨头的下游客户,例如BAT这类互联网巨头企业,研发实力强的也干脆自己研发起了数据压缩功能芯片,中国就有不止一家这样的互联网巨头企业。意在数据压缩芯片技术的产业阵容不可谓不强大,然而十年下来,并未取得实质性突破,瓶颈依旧。以上述巨头所用的开源压缩算法Gzip为例,代表压缩倍数的总共9个压缩等级,历经十年努力,上述巨头研发的数据压缩芯片通常不超过最低等级1和2,甚至连这都达不到。

在科技行业,历经多年才有一波技术突破是常有的事情,越是跨越时代的经典技术问题,越是如此。如今炙手可热的人工智能领域,曾经沉寂了二三十年的漫长低谷,近年才终于迎来深度学习技术的突破。现在,美剧《硅谷》中突破一系列行业边界的数据压缩技术,也开始在一家中国科技创业公司走进现实。

2020年,注定是一个不平凡的年份,对于DataBox和它所在的行业来说也是如此。一份DataBox VS Intel的Gzip对比测试数据显示,在行业标准数据集和客户业务数据集上,DataBox实现的数据压缩倍数最高可达Intel的2.09倍。实际上,DataBox不仅大幅超越了Intel数据压缩芯片的技术水平,甚至也超越了行业标准最高压缩等级9。在不止一位来自BAT级别产业巨头的技术专家看来,这个结果给人的第一感觉是“反常识”的。从常理逻辑分析,Gzip压缩算法需要耗费极高的计算代价才能实现最高压缩等级9,无论软件还是芯片都无法承受,因此一直以来都停留在理论上,产业实战中无法使用。尤其是对于芯片设计来说,由于芯片上的电路资源非常有限,又必须实现非常高的处理速度,只能进行相对简单的处理,从而只能实现低等级的压缩效果。研发数据压缩芯片的产业巨头,皆受困于此。DataBox能设计芯片实现超越Gzip最高等级9的压缩效果,这是颠覆上述常理逻辑的。

但这不仅是事实,甚至实际上并不是DataBox数据压缩芯片技术的最高水平。设定必须兼容开源Gzip压缩算法,理论上明显限制了DataBox的芯片设计空间。排除这个兼容限制,DataBox数据压缩芯片的压缩倍数还能进一步提升。在上述行业标准数据集和客户业务数据集上,DataBox非兼容芯片实现的数据压缩倍数最高可达Intel的3.66倍!

还记得文章开头关于水稻单产提高10%的比喻吗?这些数字背后的价值与意义不言而喻。

凭借卓越的数据压缩技术,美剧《硅谷》中的PiedPiper重塑了存储、VR、视频等一系列下游产业。现在,这个剧情正在DataBox走进现实。作为其中一个目标应用行业,DataBox瞄准了近年兴起的In-Storage Computing领域,也称为Computational Storage,中文可翻译为“存算一体”、“近存计算”或“可计算存储”。其产品形态是把计算器件(e.g. FPGA)与存储器件(e.g. SSD)集成在一块板子上,直接在FPGA上就近对SSD存储的数据进行处理,而不必通过外部数据总线(e.g. PCIE)送到CPU处理完毕再送回SSD存储,从而提升整体效率。有的厂商如三星把这个产品形态称之为Smart SSD。数据压缩正是三星Smart SSD标配的数据处理功能,通过对数据进行压缩后再存储,可允许用户实际存储数倍于SSD物理容量的数据。假设三星Smart SSD可实现3倍数据压缩,8TB物理容量的Smart SSD即可存储24TB的用户数据。按照一块8TB物理容量的普通SSD硬盘价值10000元计算,同等物理容量的三星Smart SSD可给用户提供价值30000元的实际存储容量。如果售价20000元,客户相比采用普通SSD硬盘可节省10000元;FPGA成本按照2000元计算,每块三星Smart SSD可比普通SSD硬盘多收获8000元利润,与客户实现双赢。

三星Smart SSD资料图

据透露,DataBox将发布一款Smart SSD产品,内部集成DataBox数据压缩芯片技术,可以用同样的SSD物理容量提供比行业现有产品更大的实际存储容量,存储性价比极具优势。即使只按照4倍数据压缩计算,一块8TB物理容量的DataBox Smart SSD可给用户提供相当于32TB = 40000元的实际存储容量。假设一家企业客户需要采购部署24PB实际存储容量,可采用1000块三星Smart SSD或750块DataBox Smart SSD。如果DataBox单价16000元,客户总采购成本1200万元,与三星单价12000元的总采购成本相当。DataBox每块硬盘可收获4000元利润,与客户实现双赢。三星则已无利可图。

如果DataBox为了夺取市场主导地位,适当放弃一部分利润,单价降低到15000元以内,那么三星即使不赚钱,产品性价比也将败给DataBox,而DataBox每块SSD硬盘仍可获得3000元利润。DataBox这家初创核心业务并非Smart SSD的中国芯片设计企业,将凭借核心芯片技术优势对三星这样的全球产业巨头乃至Smart SSD这个行业进行颠覆性“降维打击”。

DataBox成立5年很少露面,最近一次见诸媒体还是一年多前,DataBox的另一门类产品——大数据专用芯片硬件加速解决方案——被中国联通首次正式商用的时候。这也是中国电信运营商行业从0到1首次采用这个芯片新品类。经过至今长达一年的商用运行,部署的客户大数据集群平稳运行,顺利完成整体验收。(大数据芯片千亿风口来临,中国“芯”DataBox技压全球巨头夺得电信业首单)除了2019年完成估值达5亿美金的一轮融资之外,外界对这家中国科技公司了解并不多。此次发布Smart SSD产品,是DataBox首次详细具体地公开旗下一款产品的功能、性能与核心技术竞争力,掀起了面纱的一角。谈及DataBox的产品布局,以及这究竟是一家什么样定位的企业, DataBox始终保持低调不多置评,而是讲述了一段鲜为人知的趣闻轶事。

某全球知名VC机构的合伙人有一次与DataBox取得联系,表达了进一步了解投资的兴趣。当时,DataBox并未涉足Smart SSD。有趣的是,这家VC机构当时已是一家Smart SSD创业公司的投资者之一。交谈过程中,对方亦问起DataBox的定位和产品布局。DataBox表示,公司虽然研制销售各类芯片产品,但本质上并不是一家研发具体产品的产品型公司,更不是追逐热门的概念型公司,而是一家研发硬件加速算法与芯片技术的能力型公司。这种核心能力,应用在大数据行业,就体现为对方看到的大数据专用芯片这样的产品形态。但,产品和行业都不足以定义DataBox这样的能力型公司;公司必然,而且已经,开始运用这种核心能力进入更多行业领域。越来越多的头部企业客户使用了DataBox产品之后,不断引荐数据库、存储、网络、安全等业务部门与DataBox商谈合作,共同研发各类企业级应用的硬件加速芯片方案。未来DataBox再次跨界进入其他行业推出新门类产品,毫不奇怪。

彼时,DataBox没说的是,这种核心能力如果运用于In-Storage Computing领域,就表现为Smart SSD这样的产品形态,Smart SSD将成为DataBox核心能力降维打击的下游行业。

化繁为简,吹沙见金。商业模式创新的局限性日益被大众所认知,尤其是中美贸易战以来,核心技术被卡脖子的“芯”痛,促使中国创投圈越来越重视硬科技创新。不过平心而论,中国的硬科技创投圈常见的是另一种短平快的商业模式创新——把In-Storage Computing、Smart SSD之类的高大上新概念搬到国内,依靠模仿、收购或是挖人获取国际上的已有技术,做出一款跟国际厂商产品差不多甚至差一些的产品,最终,还是要依靠血崩价格战乃至政策保护壁垒跟对方竞争市场。炒概念,靠模仿,拼加班,砍利润……招数用尽,唯独没有过硬的核心技术优势。国产替代之类的情怀包装,并不能掩盖本质上更像是硬科技版的商业模式创新。真正敢于、能够去攻克全球行业核心技术制高点的企业,并不多见。

随着集成电路制程工艺日益接近物理极限,芯片性能每18个月翻倍的摩尔定律不可持续,采用针对特定功能专门设计的专用芯片进行硬件加速,相比采用CPU通用处理器来实现这些功能,性能、成本、功耗均可极大优化,已成为芯片产业技术的大势所趋。实际上,过去几十年,专用芯片硬件加速在每一个重要领域的崛起都造就了该领域的全球产业领导者。20世纪末,核心网络系统、大型数据库系统和3D图形显示系统采用专用芯片硬件加速,造就了高性能网络设备巨头Cisco、高性能数据库系统巨头Oracle和高性能显卡巨头nVidia;时间来到21世纪,比特币矿机系统、人工智能系统采用硬件加速芯片,又成就了比特大陆和全球众多AI芯片独角兽。大数据等越来越多的应用领域采用硬件加速专用芯片,造就的将是DataBox这类新世代全球产业领导者。

(校对/范蓉)

责编:
来源:爱集微 #DataBox#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...