中国深度求索发布廉价大模型性能比肩美OpenAI最新模型

（北京／伦敦综合讯）仅相隔两个月，中国初创公司深度求索再度发布廉价大模型，其性能可比肩美国OpenAI最新模型。

综合英国科技周刊《自然》（Nature）和英国科技网站“生命科学”（Live Science）等报道，深度求索（DeepSeek）去年12月发布免费语言大模型DeepSeek V3，并称在两个月内花费558万美元（751万新元）完成训练该模型，所需时间和费用仅硅谷竞争对手的十分之一。

中国对冲基金幻方量化旗下的子公司深度求索星期一（1月20日）发布推理模型DeepSeek-R1，在第三方多个项目的基准测试中均超越美国OpenAI开发的最新模型o1。

据美国消费者新闻与商业频道（CNBC）报道，美国微软首席执行官纳德拉星期三（1月22日）在达沃斯世界经济论坛上说，深度求索的新模型令人印象深刻，不仅因为他们有效地构建一个开源模型，还因为它的推理计算效率极高。“我们应该非常严肃地看待中国人工智能（AI）的发展”。

除测试表现优于o1外，R1的训练成本和开源开放程度也胜于o1。《自然》周刊报道称，开源开放指的是，让用户参与二次开发，可更改演算法。虽然可自由重复使用，但R1的开源开放程度仍受限，因为训练数据尚未公开。

《每日经济新闻》引述深度求索发布的技术报告称，R1的训练成本是o1的三十分之一。《自然》周刊报道称，R1给用户开出低廉的使用方案，是o1的三十分之一。

让西方科技界赞叹的是，深度求索在受美国限制先进科技输华的背景下，依然开发出新颖模型。

“生命科学”报道称，美国限制向中企出口先进AI计算晶片，迫使R1研发者采用更智能和有效的演算法，以弥补演算能力的不足。ChatGPT据报需要一万台英伟达的图像处理器处理训练数据，深度求索工程师称他们仅用2000台图像处理器就取得相同结果。

热度： ° | 返回联合早报首页可查看更多内容。

中国深度求索发布廉价大模型 性能比肩美OpenAI最新模型