徐海娜：ChatGPT引发的思考

思维空间

ChatGPT是由美国人工智能研究实验室OpenAI开发的人工智能（AI）聊天机器人程序。它于2022年11月30日发布后，用户量便达到1亿。关于ChatGPT和AI的话题一直热度不减，人们纷纷担忧哪些工作将被取代。但经过一番了解，人们可能会暂时放下这种担忧，因为迫在眉睫的事情，并不是人类将如何被取代的问题，而是这种生成式AI究竟为我们的现实和当下带来怎样的挑战，以及对教育制度提出怎样的要求。

两个多月来，人们带着好奇心和这个AI进行了各种各样的聊天，渐渐发现虽然它可以像人一样自然流畅地回答各种各样的问题，还可以生成看上去结构完美的小论文，但也有着显著的缺陷。

一个朋友毕业于新加坡国立大学计算机系，曾在IT业深耕十六七年，最近也在编程方面尝试使用ChatGPT。他在尝试新的编程语言Julia时，遇到一个小问题，无法快速使用谷歌搜索获得答案，于是就问了ChatGPT，可是它给出的解决方案看似合理却不能真正运行，最后朋友还是通过查看Julia内置文档，加上基于经验的猜测，解决了问题。虽然ChatGPT确实给出详细的解答，但朋友形容说：“看起来很像那么回事，但各种张冠李戴，属于一本正经的胡说八道。”

最近有位中国网民小汪也在网上分享一段和ChatGPT的对话。其中一个问题是“抒情和幽默是不是永远都没办法彼此融合？”它回答说：“不是。抒情和幽默并不一定不能融合，在很多文学作品里，抒情和幽默经常是有机结合的。抒情和幽默各自有其独特的魅力，但在合适的情况下，两者结合可以增强文学作品的效果。”小汪要求它举例说明，它就列举了一段对话，并说那是电影《泰坦尼克号》中，男女主人公的对话。网民却发现，那段对话在电影中根本不存在，完全是它编造出来的。

ChatGPT热度未减，谷歌公司在2月6日推出了ChatGPT的竞争对手Bard。但在首秀日，它就犯了一个事实错误。根据谷歌分享的一张GIF动图，Bard被问到：“我可以告诉我的九岁孩子关于詹姆斯韦伯太空望远镜（JWST）的哪些新发现？”Bard的回答包括：该望远镜拍摄了我们太阳系外行星的第一张照片。许多天文学家和天体物理学家都在社交媒体上指出这是不正确的，第一张系外行星图像是在2004年Chauvin等人用VLT/NACO拍摄的。

谷歌和OpenAI都是在文本生成软件上构建他们的AI，这些AI虽然能说会道，但也容易伪造事实。有AI业界评论者说：“他们不是搜寻已证事实的数据库来回答问题，而是接受大量文本语料库的训练并分析模式，以推定任何给定句子中的下一个单词出现的概率。换句话说，它们是概率性的，而不是确定性的。”

还有人指出：“这个思路就只能学习语言本身的统计信息，没有办法获得语言背后的逻辑。所以‘一本正经地胡说八道’这个事是没有办法解决的。”

这也是纽约大学终身教授、Meta首席AI科学家杨立昆（Yann LeCun）不认为ChatGPT会有重大创新，也不认为大语言模型是通用AI的正确方向的主要原因。

当有人问ChatGPT类似这种问题：“你提供的信息准确吗？”“你如何判断自己的回答是正确的？”它通常会这样回答：“我使用的是一种叫做概率编程的技术，通过学习大量的文本数据，匹配关键字和上下文，再从已知数据中生成答案。回答问题时，我会根据所学数据和模型给出最可能正确的回答，但不能保证每个回答都是正确的。”

ChatGPT的回答很坦诚。这就要求使用者有一定的信息素养和思辨能力，能够识别哪些是“靠谱的”，哪些是没有事实根据的，哪些是现实中存在的，哪些完全是AI编造出来的。人们如何在信息的海洋中，在鱼龙混杂的互联网中，找到自己需要的正确信息，既需要系统化的知识体系，也需要思辨能力。这种思辨能力也应当是当下教育的重点。

其实很多网民都发现ChatGPT的回答并不一定是正确的，它模仿专家、操纵文字的能力令人震惊。它还有一个惊人能力，能够在对话过程中学习，实时根据用户的反馈，重新修改自己的答案。尽管前述资深IT人朋友对ChatGPT编程方面的分析推理能力比较失望，但同时也承认，它的文字组织能力非常优秀，“智能”仍然超过相当多“说话不经大脑”的人类。他还对AI与搜索引擎的结合抱持相当乐观的态度。他认为如果AI结合互联网搜索，给出信源链接，将有助于人们判断真伪。这样深度结合的工具将大大提升人的工作效率。

人们还发现ChatGPT在回答政治、经济、宗教、文化等方面的敏感问题时，会尽量让自己看似“客观中立”，答案一般都是相当“政治正确”。这也显示这类AI在学习过程中，人为的干预和纠偏的成果。然而，如果学生只是止步于这些“政治正确”的回答，不去做深入的思考和辨识，就容易丧失处理敏感议题的能力。

中国作家李智勇的《终极复制：人工智能将如何推动社会巨变》一书中，有个章节集中讨论“人工智能上的失控风险”。他说：“人工智能并不能给出完全确定的结果，它指导下的行为是一种概率，这就让重度依赖人工智能的系统产生了失控的风险。”这种失控风险主要表现为“极度偏执”和“数据污染”。

当须要做价值判断、须要做决策时，机器不会像人一样，在权衡利弊时能把握好分寸，而是更容易偏向一边。其实人类本身也未必能掌握好分寸，因为这涉及很多哲学和伦理议题。不论选择是什么，人类都得面对、承担自己选择的后果，但AI机器则不必。

至于“数据污染”，ChatGPT可以说在一定程度上已经解决了这个问题，不然它不可能做到那么“政治正确”。

2016年，微软曾发布一个名叫Tay的聊天机器人，但发布不到一天，它就开始发表不当言论，例如仇视女性的言论，还为纳粹叫好，说大屠杀是编造的等等，很快就被迫下线。微软公司事后解释说，这是一个学习的机器，因为被一些跟它交流互动的人的不良诱导，才会有一些不当反应。

还有一个隐忧就是，我们无法确切知道究竟输入了什么数据给这类AI机器，也就无从准确判断它们会有怎样的行为，所以一旦数据受到污染，AI机器的行为也就更难预测。李智勇认为要对冲这些风险，需要的是既能联通，又足够分散并有效率的网络。

也许正因为上述原因，ChatGPT在回答类似“未来什么研究方向会热门”这种问题时，会回答“AI伦理”。它的兴起也带给我们很多思考：不仅是AI的应用前景，还包括技术伦理和价值选择等等。所以，教育更须要强调尊重多元文化和多元价值，教导如何运用同理心、弥合分歧、求同存异，以及提升处理复杂、敏感议题的能力。AI越先进，人类越需要更高的文明来面对它所带来的影响与冲击。

作者是童书创作者、前媒体人