如果AI芯片供应枯竭,会导致你的项目变成金钱怪兽吗?

如果AI芯片供应枯竭,会导致你的项目变成金钱怪兽吗?

各公司争相将生成式AI(GenAI)能力添加到业务中,AI芯片的需求正在快速增长,而供应却可能无法跟上,这一问题可能迫使IT领导者在未来几年寻找创新解决方案。

Nvidia已经成为AI领域的明星,其强大的图形处理单元(GPU)遍布全球数据中心。然而,Nvidia的热门产品并不便宜。其最新的Blackwell GPU每个单元的售价超过4万美元,而上一代的Hopper H100的价格也在3万美元左右。AMD则生产价格较为便宜的MI300X GPU,售价在1万到1.5万美元之间,该公司预计AI芯片业务的需求将推动其收入的大幅增长。

报告指出,企业应该预期可能会出现AI芯片短缺,预计到2026年,AI将推动组件需求增长30%以上。需求增加20%或以上将足以影响AI芯片供应链。而不仅仅是数据中心GPU面临压力,AI支持的移动设备和PC的需求将在未来几个月和几年内推动升级。

正如科技行业在疫情期间学到的那样,芯片供应链是脆弱的。虽说PC销量的大幅增加,以应对远程工作需求,但供应链短缺造成了瓶颈。

半导体供应链极其复杂,需求增长约20%或以上很可能会打破平衡,导致芯片短缺。AI的爆发可能会迅速突破这一阈值,在供应链中形成脆弱的瓶颈。

如果需求预测按目前的轨迹继续增长,报告称,半导体的关键组件需要在2026年前将生产能力几乎增加三倍。

尽管目前需求高企,但供应,目前来看尚且充足。我们认为可能有几个因素会导致芯片短缺,在过去几年里AI领域的快速发展。

如果出现一个顶级的AI应用,所有人都在等待的那个应用,可能会真正推动AI PC的普及,或者是手机周期的升级,这将带来对大量不同类型半导体的需求,可能会导致供应链各方面的紧张。

这种芯片短缺将推高AI项目的成本。经济学的基本法则表明,高需求和低供应会导致价格上涨,并会继续推高价格,直到市场达到‘牛鞭效应’的另一端……也就是供应重新超越需求时,这种现象自然会导致项目成本超出预算。

供应链约束

像AMD和Nvidia这样的美国公司依赖中国台湾半导体制造公司(TSMC)生产芯片。TSMC已经在亚利桑那州建设了好几年了,即使它们能够提高产能,仍然只是生产量的一小部分。这将是一个需要几十年的过程。

尽管还未达到短缺的阶段,但TSMC正在努力跟上需求激增的步伐。

TSMC首席执行官表示:“我试图平衡供需关系,但今天无法做到。需求如此之高,我必须非常努力才能满足客户的需求。我们继续增加生产。”

魏哲家表示,AI芯片的库存“仍然非常紧张,可能会一直持续到2025年,希望到2026年能够得到缓解。”

他说:“我们在尽最大努力,随时随地都在努力。所有我的客户……都在寻求未来几年的领先产能,我们正在与他们合作。”

如果发生重大事件,影响将是巨大的。这就是为什么很多公司推动TSMC进行多元化。

预计将会看到越来越多的投资流入印度等其他市场的芯片生产。

IT领导者可以做什么

CIO和其他IT领导者面临着巨大的压力,需要迅速制定生成式AI战略,以应对潜在的供应短缺问题。考虑到单个单元的成本,花费很容易就会达到数百万美元。

但这并不是公司第一次应对半导体短缺。疫情期间,远程工作需求激增导致PC销量大幅增加,而全球运输中断则导致芯片短缺,影响了从冰箱到汽车再到PC的所有产品。

我们学到的一件事是供应链弹性的重要性——不要过度依赖任何一个供应商,并理解你有哪些替代选择。当我们与客户合作,确保他们拥有更具弹性的供应链时,我们会考虑几个因素……其中之一是确保他们重新考虑,要为最关键的组件保留多少库存,以便能够应对潜在的冲击。

另一个因素是地理弹性,即了解你的组件来自哪里,并且你是否觉得自己过度依赖任何一个供应商或地区。

Nvidia的GPU更难找到替代品,但其他芯片则有替代品。在其他领域,你可以双重采购,或者在市场中找到更多的弹性。

领导者必须关注预测。预测对公司来说非常关键,但在一些可能有周期性的市场中也很具有挑战性。但你越能预测自己的需求,并与供应商密切合作,确保他们理解你的预测,整个供应链就越有可能具备足够的产能。

与供应商的实时沟通也至关重要。IT领导者应该“数字化供需信号,并与多家供应商进行沟通。这可以在全球宏观和微观的供需信号强烈波动时,提供先发优势。

未经允许不得转载:A5数据 » 如果AI芯片供应枯竭,会导致你的项目变成金钱怪兽吗?

相关文章

contact