尽管美国科技巨头在AI GPU领域投入巨额资本,但腾讯首席战略官詹姆斯·米切尔认为,DeepSeek的AI技术突破表明,这种高投入可能并非必要。
DeepSeek声称以远低于美国同行的成本开发出性能相近的AI模型,这一说法似乎已对股市产生了深远影响。
其最大的“受害者”是英伟达的股价,该公司在1月份的抛售中损失了近6000亿美元市值,至今尚未恢复。英伟达本周早些时候举行的GTC大会也未能给投资者留下深刻印象,尽管首席执行官黄仁勋强调了其产品在多个万亿美元市场中的潜力,但股价依然表现平平。
詹姆斯·米切尔透露,该公司此前在英伟达AI GPU上的支出主要用于训练大型语言模型(LLMs)。在DeepSeek的产品走红一个多月后,腾讯推出了其混元Turbo S AI模型。该公司以DeepSeek的产品为目标,声称其模型可以在不到一秒的时间内响应查询。
然而,在与DeepSeek竞争开发最快AI模型的同时,腾讯也认为这家初创公司的训练突破显著降低了AI开发成本。DeepSeek声称通过先进的软件工程降低了AI开发成本,使其能够访问GPU的核心功能。通常情况下,工程师依赖英伟达的CUDA软件来使用芯片,但这种便利性是以对产品更严格的控制为代价的。
在谈到AI GPU的资本支出时,米切尔表示,“资本支出的第二个用途是用于大型语言模型训练的GPU。”在DeepSeek分享其模型开发过程之前,这一用途非常重要。这位腾讯首席战略官补充说,“去年有一段时间,人们认为每一代新的大型语言模型都需要增加一个数量级的GPU。”然而,根据他的说法,DeepSeek改变了这种看法,至少在中国公司中是如此。“随着DeepSeek展示的突破,这段时间结束了,”米切尔说。