专家座谈:人工智能在芯片设计中的应用日益突出

来源:爱集微 #人工智能# #数据#
1.9w

美国Semiconductor Engineering杂志举办座谈会,讨论人工智能在管理数据、改进设计方面的作用,以及其在路径搜索、防止无记载数据损坏方面日益增长的作用。参加会谈的人员包括Cadence公司研发副总裁Michael Jackson、美国国家仪器公司半导体和电子工程副总裁Joel Sumner、Meta公司产品工程经理Grace Yu和德克萨斯大学奥斯汀分校电子与计算机工程系教授David Pan。以下是这次对话的节选,在DesignCon技术展会现场观众面前进行:

SE:如今,每个人、每件事都在收集大量的数据。那么它们要储存在哪里,储存多长时间?如何确定哪些是相关的?

Sumner:可以看到人工智能首先应用于那些拥有非常庞大和强大的数据存储的地方。很幸运,半导体生产测试基础设施是按照标准格式运行的,所以它允许其进入这些非常庞大的数据库中,并有很好的标记,标记为通过的和不及格的。这为我们研究这些提供了跳板,并将其作为一个校样版,因为其在许多其他行业的验证和任何自动化方面都有适用性。但是在很多地方,这些数据存储并没有以标准的方式存在。它存在的地方就是我们看到的应用。

SE:所有数据都存储在一个地方吗?这些数据今后将如何使用?

Sumner:由于种种原因,它最终会被分散出去。其一是它很实用。其二,这涉及到客户数据。所以不一定要删除所有数据。例如,在设计链的多个位置运行人工智能算法,在云端、也在离数据源很近的地方运行它们。这就需要分散数据。但与此同时也需要所有你想要查看的数据,将模式训练在一个地址且容易访问。

Pan:可以使用这些数据来帮助做出更好的决策。例如,我们可以生成数万个不同的布局,然后进行模拟、提取和最终布局。这是对设计专家的补充。

Jackson:从 EDA 角度来看,创建新数据通常可以通过排列或随机创建布局来完成。因此,可以综合地制造问题,成为另一个数据源。这是 EDA 的优势之一。

SE考虑到数据量,所有这些是在云端还是在本地完成?我们讨论的是非常大的数据集,需要更强大的计算能力。

Jackson:这要看公司的情况。我正在做印刷电路板设计,也用人工智能做一些工作,云端中存储有很多可以实现人工智能的计算能力。小公司可能愿意将数据保存在云端中,但大公司则希望在私有云中运行数据。

Pan:数据隐私当然是一个大问题,是机器学习的一个重要领域。但是不必传递数据,可以对数据进行加密,然后进行同态计算。安全计算是一个新兴的研究领域。因此,在不共享数据的情况下仍然可以对其进行检查。

Yu:这取决于谈论的是哪类数据。Meta对客户隐私有非常严格的政策。只有需要访问数据的人才能进行访问。每个加入 Meta 的员工都要接受数据隐私的年度培训。设计数据则取决于项目。一些数据存储在本地服务器上,利用云端访问大数据,还可以进行模拟和验证。所以要具体情况具体分析。

SE:硬件老化对人工智能行为有什么影响?

Sumner:谈到老化问题,那么谈论其运行的环境就很重要。不是算法老化,而是训练数据。因此,根据一组特定的制造数据对其进行了培训,这种制造数据则是来自于一个特定的制造环境。然后,随着时间的推移发生了变化。您将看到两种情况之一。一个是整个系统的漂移,所以人工智能现在必须检测到这一点,因为整个系统已经离最初的训练数据够远,需要进行重新训练。第二种情况是,一些设备出现了一些与之前完全不同的东西,导致算法不得不说,‘等等,等等,我不是最佳答案。现在我需要咨询人类,因为这太远了。’这两个都是系统衰退的例子。不断的更新是必要的。

Jackson:我同意。不断的再培训是解决老化问题的必经之路。但是,随着软件接触到越来越大的训练集,它也在不断发展中,其效率也越来越高。

Pan:从头开始再培训代价高昂。相反,可以进行迁移学习。例如,几年前我们从事热点检测工作。在检测到14纳米的东西时可以将其迁移到7纳米处,而不必从头开始。可以使用原始机器学习架构,但是可以从中间的某个地方开始。

SE目前的一个大问题是无记载数据损坏,这是硬件缺陷造成的。我们能否利用人工智能在系统中进行追踪,并找出问题及其原因?

Yu:人工智能和其他工具一样并不完美。但是避免这些问题的方法是让人频繁地做验证测试,或许可以使用一个已知场景来运行人工智能和计算机,看看能否得到预期结果。使用像这样的简单方法可以识别问题和错配,并深入研究这些领域。工程师不完美,人工智能也不完美。不断改进就要经常反复检查,以避免这类问题。

Jackson:我们在整个验证领域投入了大量资金、人力和精力,因为这涉及到加速或协助设计,以及这些设计中功能问题的调试。所以我们肯定认为这是个最佳着手点,并把大量的精力投入到人工智能上。

SE这只是在设计阶段完成的,还是贯穿整个芯片的生命周期?

Jackson:在某种程度上,这贯穿芯片的生命周期,包括测试、部署和问题的调试。

Sumner:这项技术非常适用于那些需要大量人员全力投入并想出解决办法的工作,而且能够在做到这一点的同时移除大量枯燥但有困难的工作。最终的目标是让你能够晚上回家,早上回来,并得到一份报告说,‘我已经仔细检查千兆字节的数据,甚至更多,这里你应该看看。不是说这有问题,但可能会有,所以看看这个。’这些问题就像大海捞针一样,把它们转化为专注于解决产品问题的努力。它也可以用于将算法更加可靠,创造一种可以信赖的感觉,因为它经过测试,也知道它的来源值得信赖。

Pan:有正式方式来验证一些东西,也有模拟的方法。最终,我们需要两者都有良好的覆盖面。理想情况下,我们希望能够在流程的早期识别那些导致无记载数据损坏的奇怪故障。这是目前非常活跃的研究课题。(校对/武守哲)

责编: 武守哲
来源:爱集微 #人工智能# #数据#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...