![阿马尔·比德:DeepSeek真的是威胁吗?](/uploads/allimg/250207/0J5532920-0.jpg)
将国外的变革性进步,视为对国内福祉的威胁是错误的。盲目追求技术或科学领先,是一项愚蠢的事业。重要的是,企业和消费者是否愿意并有能力开发和使用源于前沿研究的产品和技术,无论它们来自何方。
通过自学成才从电报员成为企业家的爱迪生,他常被认为是有史以来最伟大的发明家;而尼古拉·特斯拉(Nikola Tesla)在移民美国之前,曾在巴黎的爱迪生公司工作过,要不是马斯克的电动汽车公司,几乎没有人记得他。然而,使大规模电气化变得经济实惠的,是特斯拉在交流电(AC)技术上的突破,而不是爱迪生的直流电(DC)技术。直流电的高昂成本,会让爱迪生的城市电气化技术成为富人的玩物,就像他的许多其他发明一样。
中国投资者梁文峰的深度求索(DeepSeek)人工智能模型能否代表人工智能领域的类似突破,还是只不过是像低温核聚变和室温超导那样的骗局?如果这些模型得到证实,美国应将它们视为致命威胁,还是送给世界的礼物?
与许多变革性技术一样,在OpenAI于2022年底发布ChatGPT引发狂热之前,人工智能已发展了几十年。更好的算法、手机等辅助设备,以及更便宜、更强大的云计算,让这项技术的应用变得更加广泛,但却几乎无人关注。反复试验已显示,人工智能在哪些方面能够或不能超越人类的努力和判断。
ChatGPT和其他大型语言模型(LLM)神奇的流畅表达能力,让人们产生一种错觉,以为生成式人工智能是一项全新突破。ChatGPT在发布五天内就拥有100万个用户,两年后每周用户数量达到3亿。微软、Meta和Alphabet等高科技巨头,在人工智能产品和数据中心上投入了数十亿美元赌注,很快就忘记早先对虚拟现实和增强现实的热情。
2024年,投资20亿美元(约27亿新元)研发Blackwell人工智能晶片的英伟达(Nvidia)成为全球最有价值的公司,市值在两年内增长九倍。英伟达首席执行官黄仁勋预测,未来几年将有1万亿美元投资于使用此类晶片的数据中心。所有这一切都让苹果公司对人工智能的谨慎、观望的态度,显得古板过时。
新的人工智能,并没有为最终用户提供与巨额投资(更不用说对电力的无尽需求)完全相称的价值,但这没有关系。人们认为超大规模数据中心将降低人工智能的成本,而模型使用越多就越智能,因此投资持续增长。
LLM的重要局限
但是,在光鲜的外表下,LLM和许多已有几十年历史的人工智能模型一样,无非是使用模式识别和统计预测来产生输出,这意味着它们的可靠性,取决于未来是否与过去一样。这是一个重要的局限。人类可以用想象力解释历史证据,预测未来可能发生的不同情况;人类还可以通过相互之间,天马行空的对话改进自己的预测。人工智能算法则不能。
但是,这一缺陷并非致命。因为遵循自然规律的过程自然是稳定的,所以未来在很多方面都与过去相似。只要有明确的反馈,人工智能模型就能通过训练变得更加可靠,即便底层过程不稳定,或者反馈不明确,统计预测也能比人类判断更具成本效益。由谷歌或Meta算法提供的离谱广告,仍然优于盲目的广告。对着手机口述文字可能会产生错误,但仍然比在小屏幕上打字更快捷方便。
到2022年,敏锐的创新者已发现无数基于统计的人工智能,足以胜任或优于依赖人类判断的案例。随着电脑硬件和软件的进步,具有成本效益的使用案例必然会扩大。但是,如果仅仅因为LLM可以像人类一样交谈,就认为LLM是一个巨大飞跃,那就太痴心妄想。根据我的个人经验,LLM应用程序在做研究、编写摘要或生成图形方面,简直一无是处。
尽管如此,有关DeepSeek的报道,还是在金融市场掀起轩然大波。DeepSeek声称,它只靠低端英伟达晶片,就实现OpenAI和谷歌水平的人工智能性能,训练和运营成本只有后两者的几分之一。如果消息属实,高端人工智能晶片的需求将低于预期。正因如此,DeepSeek的消息让英伟达的市值,在一天之内缩水约6000亿美元,同时也重创其他半导体公司,以及投资数据中心或向数据中心售电的公司的股票。
对地缘政治影响如何?
诚然,DeepSeek的说法可能未必准确。特斯拉在取得交流电突破后的诸多所谓发明都是夸大其词,甚至纯属欺诈,而苏联的宣传机器也经常在取得真实进步的同时,编造科学和技术突破。但是,节俭的、打破常规的创新可以带来变革。看看马斯克的低成本、可重复使用火箭即可略知一二。印度成功执行火星任务的成本仅为7300万美元,比好莱坞科幻电影《地心引力》的预算还低。
如果得到证实,DeepSeek的技术对于LLM的意义,就如同特斯拉发明交流电对于电气化的意义。尽管它无法克服回顾性统计模型不可避免的局限性,但可以让这些模型的成本效益足够高,得到更广泛的应用。开发LLM模型的公司,将不必再依赖意在锁定它们,进而大获其利的大型运营商所提供的补贴。对资源要求较低的模型,可以减少对数据中心的需求,或有助于将数据中心的容量,用于更经济合理的用途。
这对地缘政治影响如何?去年春天,美国参议院两党人工智能工作组的一份报告呼吁,每年在非国防人工智能领域“紧急”支出320亿美元,据称是为了更好地与中国竞争。风险投资家马克·安德烈森(Marc Andreessen)将DeepSeek的到来,形容为“人工智能的斯普特尼克时刻”。美国总统特朗普认为,中国的人工智能模式“为美国工业敲响了警钟”,美国工业应该“精准聚焦,在竞争中取胜”。他已宣布计划对从中国进口的半导体征收新的关税,而他的前任已对高端人工智能晶片实施出口管制。
我在《风险经济》(The Venturesome Economy)一书中指出,将国外的变革性进步,视为对国内福祉的威胁是错误的。盲目追求技术或科学领先,是一项愚蠢的事业。重要的是,企业和消费者是否愿意并有能力开发和使用源于前沿研究的产品和技术,无论它们来自何方。DeepSeek的开源人工智能模型也是如此。
当然,我们也须要遏制敌对政权将西方尖端技术用于军事威胁。但这是一个不同且困难的挑战。如果可以通过出口管制来解决这个问题,我们早就不用担心朝鲜或伊朗的核武器了。
作者Amar Bhidé是哥伦比亚大学梅尔曼公共卫生学院(Mailman School of Public Health)卫生政策教授
英文原题:Is DeepSeek Really a Threat?
版权所有:Project Syndicate, 2025.