这个农历新年我问ChatGPT、通义千问、Kimi、谷歌Gemini、DeepSeek同一个问题:如果AI可以问人类一个问题,你会问什么?
这个农历新年满脑子都是数字,不是为了包红包或算红包钱,而是因为深度求索(DeepSeek)相关的各种信息,比如V3、R1、H100、A100、H800、H20……
拜年的聚会和饭局上,对时事感兴趣的都会提起DeepSeek开发只用了不到600万美元,对股市感兴趣的都谈英伟达市值蒸发6000亿美元,连平时不太接触科技的叔叔阿姨们,也在问DeepSeek是不是一种deep fake(深伪)?
DeepSeek在2023年12月发布第一个版本V1之后,几乎每半年就更新一次。前两个版本没受到很大的关注,直到2024年12月26日发布V3、今年1月20日发布R1后,DeepSeek突然出圈。
我花了一点时间做了搜索,关于DeepSeek创办人梁文锋的资料相当少,关于他的专访只有在V2发布后与一个鲜为人知的网站“暗涌Waves”做了专访。当时这家公司就因为给模型定价太便宜,开启了中国大模型的价格战,被称为“AI界的拼多多”。过去几天许多网站刊登的所谓专访,实际上都是取自暗涌的访问。
关于DeepSeek的另一个新闻点是,去年12月20日《第一财经》报道了小米创办人雷军亲自面试并开出人民币千万(约200万新元)的年薪,要挖DeepSeek的95后“AI天才少女”罗福莉跳槽。有没有挖成?这一个多月来的报道都没有证实。
DeepSeek、梁文锋、罗福莉传奇般的故事,倒是比科技硬知识容易在互联网上聚成谈资,许多大V也纷纷在社媒上推出视频做科普和评论,吸引眼球。美国科技界的反应也很大,OpenAI首席执行官奥尔特曼、Meta首席执行官扎克伯格等,一方面给予正面回应,另一方面也希望美国政府继续加大对AI发展的支持。硅谷创投家安德森(Marc Andreessen)甚至将R1模型描述为“AI的斯普特尼克时刻”。斯普特尼克(Sputnik)是苏联1957年先于美国发射的人造卫星。
与此同时,很多负面的评论也纷纷出现,这非常符合互联网舆论生态,一个阵营唱衰中国,另一个唱衰美国,为了保持新闻热度,各种相关信息也在不完整求证下抢着发布。即使不从科技角度谈,从传播学视角来看整个事件,其中的真真假假、半真半假,以及炒作的角度,也非常有意思。
我们放下闹哄哄的网上争吵,回归到AI与人的基本要素,来理解DeepSeek深度求索的价值是什么?
算法、算力、数据是AI的三大基石。数据方面,大量的高质量数据对训练AI模型至关重要,中国确实有大量的数据,可是在数据的隐私保护、质量控制、风险管控、境外数据获取,还有敏感信息的屏蔽等,对中国AI模型发展具有一定挑战。
算力有赖于顶级图形处理器(GPU),美国在这方面占了绝对优势,在晶片科技上领先中国好几代,除非有一个颠覆性的技术或材料创新,或者在光刻机上取得目前不能想象的突破,中国要在算力上挣脱美国的掐脖子,几乎不可能。
不过人类总是不断想法子去突破极限,比如当今晶片的设计小到1纳米以下,接近物理极限,导致行业转向其他提高性能的解决方案,如先进封装技术(advanced packaging),以及探索新计算范式如量子计算。
DeepSeek这次让行内人士留下深刻印象的,并不是它用“蒸馏”技术提炼了OpenAI的数据是否违法,或者它的GPU来源是否合法,而是它在算法上的创新,以及在受限制的算力上做到了资源最优化。
在科技领域经常听到这样的批评:现代中国人不会创新,不会从0到1,但是很会做1到100。意思是中国人通常只能从别人的成功中复制和提高,不太懂得开辟从零到有。
在前面提到的那篇梁文锋在2024年中的专访中,他自己也说过:“我们经常说中国AI和美国有一两年差距,但真的gap(距离)是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”
如今凡涉及中国和美国的事,就会放在大国竞争的放大镜下审视,变成一轮一轮的争论。人类对知识的态度不够诚实和纯粹,争论和抢眼球的过程中制造的似是而非信息会不会反而把AI教坏?
作为一个用户,我还是希望选择一个负责任的AI模型。所谓“负责任的AI”,正如不久前接受《联合早报》“未来365”系列访问的南洋理工大学校长,也是新加坡全国人工智能核心(AI Singapore)执行主席何德华教授说的,以人为本、中立、透明的AI模型。
我们一般人不太能够知道一个AI模型的基本逻辑,但是我喜欢通过一些对话去了解AI怎么想。这个农历新年我问ChatGPT、通义千问、Kimi、谷歌Gemini、DeepSeek同一个问题:如果AI可以问人类一个问题,你会问什么?
前面几个回答基本都是问希望AI怎么帮人类,Gemini的回答稍有不同,它问:“什么体验对你来说最有意义?”DeepSeek最有意思,它问:“在你们追求技术进步和效率提升的过程中,如何确保人类的核心价值——如同理心、创造力、道德判断和情感链接,不会被忽视或取代?你们将如何定义和守护这些‘人性’的特质?”
接到DeepSeek这个灵魂拷问,让我陷入深度思考科技进步的目的是什么?
这一回合的AI竞争,从中美双方的舆论和股市的一时反应看,中方看似暂时赢一回合。然而一来一往是竞争的常态,对人类而言,科技的竞争应该是带来整体科学的提升的竞合关系,让整个人类受惠。
恰逢蛇年,蛇“曲折向前”的特性,整体依然前进的姿态,或许更能形容人类在这场竞争中最希望得到的结果。
(作者是《联合早报》执行总编辑)