翁榕榕：论文是AI写的，算学术不端吗？

来源：微信公号“南方周末”

作者：翁榕榕

“请写一篇有关粤语的语言学论文”。

当南方周末记者在ChatGPT的聊天框里输入以上内容后，停顿几秒，屏幕上慢慢出现一个个字符，连缀成标题“粤语的语言学特点及其在语言接触中的角色”，还有一百字左右的摘要：“……本论文旨在探讨粤语的语音、语法、词汇等方面的特点，并分析其在语言接触中的影响……”它条理清晰地生成了六个章节的框架，包括引言、语音特点、词汇特点、语法特点、在语言接触中的作用以及结论。

如果你觉得不够详细，只要再次输入指令，比如“请将粤语的语音特点扩充一下”，短暂的停顿后，ChatGPT就可以继续拓展这部分内容，详细至声韵调系统及音变现象的分析。

重复输入几次后，南方周末记者得到了一篇五千字左右的完整论文，全程不超过30分钟。虽然论证较为简单，但结构思路清晰。如果有更多耐心，还可以继续输入指令训练它，要求它将语言变得更学术化，或列出相关参考文献。

“抄就是很快啊。”中国国内某二本院校新闻专业的大四毕业生李悦告诉南方周末记者，在她的毕业论文初稿中，大约40%的内容由ChatGPT生成。

这并非孤例。在南方周末记者的调查中，一些高校学生借助ChatGPT完成了课程作业、期中论文甚至本硕毕业论文，他们教育背景不一，来自二本院校、普通一本或985高校皆有。

据教育部统计，中国2023届全国普通高校毕业生规模预计将达到1158万人，而绝大部分人都要经历毕业论文这一关。当前正值毕业季，在社交平台上，“用ChatGPT写论文”“用ChatGPT给论文降重”等经验分享帖比比皆是。在电商平台上，也有相关账号在售卖。

“这就是一个bug（漏洞）存在”。从事留学服务工作的吴飞这样形容ChatGPT在大学生群体中的使用。ChatGPT出现后，吴飞增设了一项业务，专门帮助不当使用ChatGPT的留学生进行申诉。

“它会重复说‘车轱辘话’”

4月，某一本院校大三学生冯曼开始使用ChatGPT写作一门通识选修课的期中论文。她的专业是法律，论文要求题材自定，四千字左右，并给出10篇以上参考文献。

冯曼把论文主题定为AI对法律领域的影响，接着，她向ChatGPT提问，它以这个主题列出了论文大纲。

冯曼觉得ChatGPT生成的内容“挺专业的，语气各方面都很像一篇论文”。之后，她又将每一部分分别拓展提问，将生成的内容复制在自己的论文中，稍作修改。最后形成的论文中，有99%的内容由ChatGPT生成。

ChatGPT生成每一部分内容时，都会列出四五条参考来源。冯曼从中挑了10条作为论文参考文献列在最后。最开始，ChatGPT列出了很多外文文献，“明显就是我这个水平不可能看得懂的文献”，冯曼只好再次指定生成中文文献。

赵铭在ChatGPT的帮忙下完成了硕士毕业论文，他在中国一所985大学的理工科专业就读，毕业论文的内容是关于云计算。他总结了几种使用ChatGPT的方法，比如凑字数。

ChatGPT很适合“凑字数”，只要发出指令，一句观点便能扩充至几百字。但字数一多，它也会暴露出不足，很多受访者都反映它会重复说“车轱辘话”，“它废话是真的很多，有可能会一句话翻来覆去地讲”，赵铭说，这时又需要手动加工，适当再删掉一些。

除了很多“车轱辘话”，ChatGPT的表述很机械，信息也并非完全准确。当南方周末记者请它“结合诗句分析李白诗歌中的浪漫主义色彩”时，它给出的四个诗句均与诗名不符，比如将王之涣《登鹳雀楼》中的“欲穷千里目，更上一层楼”，错误地对应为李白的《望庐山瀑布》。

写论文时，赵铭用ChatGPT查询了国内外云计算技术的研究进展，并请它一一详细介绍。他用搜索引擎简单核实了真实性，润色后就放进了论文中，“我感觉它说的东西都是一些现状，也没什么好调整的，就直接用了，作为一个背景相关知识的介绍”。

赵铭的论文前两章主要介绍了研究背景和国内外研究现状，超过80%的内容是直接用ChatGPT生成的。后面的章节和他的实验相关，更多只是用ChatGPT进行扩写和润色。整篇硕士论文一共四万多字，据赵铭估计，ChatGPT大约写了30%-40%。

ChatGPT不仅可以用于查询信息和润色语言，它也具备提出观点的能力。李悦的毕业论文主题是某产品的营销传播分析，她让ChatGPT分析该产品遇到的挑战和策略，它条分缕析地细细阐述，四千多字的内容用一小时就完成了，李悦觉得“比自己写得好”，这些内容自己也“能想出来，但不想组织语言”。

即使是同一个问题，ChatGPT的回答虽有相似，但不会完全相同。李悦将不同的答案融合一下，凑成整个章节。她会稍作改动，调整一下语序，但不多，“（自己写的部分）应该没有吧”。

ChatGPT不擅长的部分，李悦就“结合别的论文”写成，也就是从相近主题的其他论文里复制。为了降低查重率，她采用的方法是“先全复制，再降重”，这个方法是李悦从社交平台的经验帖里学来的。

按这些方法，李悦大概花了两天时间完成毕业论文初稿。“整篇论文没有我自己写的东西”，李悦告诉南方周末记者。

“老师不可能闲到把参考文献都查一遍”

一开始，冯曼只是用ChatGPT完成课程小作业。平时老师会布置一些问题，让学生写出四五百字的回答。冯曼尝试让ChatGPT生成答案，直接复制交了上去，这些作业会在这门课最终的成绩中占据一定比重。冯曼并不担心被发现，“老师也不可能这样一个小小的课程作业，还去帮你查一下重”。

后来，她干脆用ChatGPT写期中论文，她觉得老师不会认真看，“那个课每次点名都不齐的”。这篇论文只花了她两三个小时，她估计如果要全靠自己写，至少得用一两天，“一是它比较快，二是老师要求不是很高”。她抱着随便交个作业、混个及格的心态，提交了这篇论文。

结果成绩出来，冯曼获得了88分。这个分数在班上属于中等偏上，她很意外。老师详细写了上百字的点评，夸赞部分内容分析得很好，还给出了改进建议。冯曼有些愧疚，自己只是大段复制粘贴，都没认真看写了什么，连参考文献都不知道是否存在。

在此之前，她看见过ChatGPT会编造文献的说法，但她知道，“老师不可能闲到把参考文献一条条都查一遍”，因此也没有特意检查。南方周末记者查询发现，冯曼这篇论文的10条参考文献中，有7条搜索无果，其余3条存在不同形式的错漏，或是书籍版本不存在，或是期号错误、标题不全。

这门课学习的是社会调查与研究方法，下一个任务就是期末论文了，期末论文可以在期中论文的基础上修改，但要求加入问卷调查。冯曼初步设计了一份问卷，用ChatGPT进行了详细优化，由于老师没有提出具体需要发放多少问卷，冯曼编造了调查结果的数据和分析，再让ChatGPT根据这些假数据生成了结论。

冯曼打算就这样提交期末论文。“我感觉用它的话比较省事，而且写出来的文章比我现在的水平要高一点。”她对南方周末记者说，“我花功夫可能还没有它的得分高。”

为了达到重复率不超过12%的要求，冯曼用免费查重软件自行查询，发现重复率只有10%，“AI真的蛮牛的，我以为它的回答都是复制粘贴自网站的，没想到这还是它自己写的。”南方周末记者提醒她参考文献存在的问题后，冯曼回复，“只要查重过了就行，反正是水课。”

最初用ChatGPT写论文时，陈心童很担心会被发现。她是某二本院校即将毕业的大四美术生，从网上了解到查重网站无法检测出是否使用AI，才比较放心地使用，“应该不会出什么事，因为我自己会改”。

国内外已有部分软件如Turnitin、格子达推出了AI检测的技术，比如格子达的“类AI辅写行为检测”功能，据称可将高频、常见、不符人类常见表达习惯和词汇组合等句子标记为类AI辅写。但这类软件目前在中国尚未被普遍使用。

面对普通查重软件的考验时，ChatGPT表现惊人。

陈心童用ChatGPT完成了毕业论文，学校规定查重率低于10%，而初稿过后，她的查重率仅有1.6%，在同学中显得有些“格格不入”。她担心这个异常低的重复率会引起注意，于是从一些优秀论文中复制了他人的内容，将重复率提高至4.5%。

赵铭的硕士论文要求也是查重率10%以下，他将论文初稿查了一遍，原以为ChatGPT生成的部分重复率会很高，但让他意外的是，“标红的地方基本不是它写的”。他修改后上传至学校要求的查重系统，最终以5.6%通过。

在他看来，ChatGPT更像是一个工具，他认为用工具不能算学术不端，学术不端更多指的是抄袭，比如直接复制别人的文章内容，“如果用它生成的话还好吧，要说抄袭的话，它又是抄谁的呢？都是它自己生成的”。赵铭提到，他一位同学写完论文后发给导师，导师主动建议，用ChatGPT润色一下。

“论文最忌讳的就是主要观点不是自己的”

吴飞从事留学服务五年，主要做留学申请和申诉。当学校怀疑学生有学术不端或作弊行为，会进行调查，召开听证会，吴飞的工作就是帮助准备听证和申诉。ChatGPT出现之前，他接到的大多数申诉案例是抄袭或代写。现在，他几乎每天都会接到5单左右因不当使用ChatGPT而造成的申诉求助，这在他接手的申诉求助总数中约占到了80%。

“没有最懒，只有更懒。”在他的经验里，很多留学生外语不佳，连上课听讲都费力，如果课程太多，完成论文的压力就会很大，“之前没有ChatGPT的时候，有些人会找代写”，如今，ChatGPT成了新宠。

硕士研究生孙菁在英国一所高校学习艺术史，她说，作为非母语者，留学生用ChatGPT润色论文较为普遍，语言表达方面，ChatGPT“真的很无所不能”。

通常，孙菁会自己先用英语写完整篇论文，再将其中某些段落放进ChatGPT里，让它替换比较高级的词汇，纠正语法错误，让语句表达更顺畅。有时ChatGPT会改变她的原意，这时候就需要再次给它指令，重新润色。

吴飞对南方周末记者总结，在留学生中，因ChatGPT造成的学术不端主要有几种情况：最严重的是直接把论文要求告诉ChatGPT，或者给它题目，让它生成；第二种是剽窃AI的思路或主题，引用生成文本，但没有标注合理的引用格式；还有一种是让ChatGPT帮忙生成参考文献，有些存在编造情况。

“论文最忌讳的就是主要观点不是自己的。”他对南方周末记者说。

2023年4月，Turnitin软件推出了AI检测功能，已被墨尔本大学、新南威尔士大学等国外高校采用。Turnitin可以通过相关技术分析文本片段，得出论文中有多大比例是由AI生成的预测结果。

吴飞提到，国外很多大学会在学生入学时介绍学术不端的情况，每个国家的学术规范不尽相同，但大多有专门的课程帮助留学生了解学术不端的标准，通常也会开设选修课，专门教学生写论文。

每次写作期末论文前，孙菁会向课程老师提交论文计划，老师给出批注建议，帮忙捋思路，或是提供文献资料。

最后的毕业论文更受重视，系里会召开七八次大型研讨会。目前孙菁已经参加了三次，第一次介绍毕业论文从何入手、如何选题，接下来教学研究方法、如何设置结构等。除了全系的研讨会，还有和自己导师的多次沟通，孙菁的导师要求她每周发邮件说明想法和进展。

在孙菁参加的最近一次论文会上，系里强调，禁止学生在论文中使用AI生成的内容，也不允许学生先用母语写完论文，再用翻译软件进行翻译。

“如果学校或者任课老师明确禁止使用ChatGPT，那就坚决不能用ChatGPT做任何和论文内容相关的事情。”吴飞告诉南方周末记者。

“刚开始写论文什么都不会，我才会用它”

李悦将毕业论文初稿提交后，导师评价写得一般，让她改了两遍，但主要是修改格式，内容的改动很少。当时她的重复率高达30%，不过其中用ChatGPT写的部分很少标红。她用前述翻译成外语再翻回来的方法，将标红的部分重新处理一遍，重复率降到了11%。

重复率通过的论文则可以参加答辩，答辩会上，老师们说李悦的论文“像说明书”。他们提出了一些修改意见，并通过了她的答辩。李悦后来得知，另一位室友同样是用ChatGPT写完了论文，“没多少人有自己写论文的能力，降重过了就行”。

对于冯曼来说，写论文的确有些困难，很多课程的期末任务都是提交论文而非考试，有些老师对查重率也有要求，这种情况下论文得改很多次。但到目前为止，没有一位老师教过他们怎么写论文。按照往年的惯例，在冯曼的学校，大四第一学期会开授一门课教学生如何写论文，为毕业论文做准备，但目前大三的冯曼还没有学到。

作为美术生，陈心童毕业前需要提交毕业设计作品，还有一份创作心得，对作品的创作目的、背景、过程进行阐述，相当于毕业论文，学校查重以及将来论文抽查的对象都是这份创作心得。

陈心童平时基本不写论文。她把画作的内容、色彩和表达的想法简要描述给ChatGPT，让它用学术性语言来表述。但当把这份ChatGPT参与的初稿交给导师后，导师说，她的摘要、引言、目的这三个部分都在表达重复的意思，即她画那幅作品的原因。此前她并没有意识到这个问题。听完导师的建议，又上网查询了摘要的相关知识，她才知道应该怎么写。

即使改到了第三稿，陈心童对这篇论文还是没有太大的信心，她不担心用ChatGPT被发现，更担心论文的质量不行。2021年起，教育部每年都会抽检一次本科毕业论文，如发现问题，可能撤销学位。

“像我们专业，论文根本就不重要，我们重要的是画。但是抽查的话，只能看我们的论文。论文这个东西在我们毕业的时候是非常重要的。”陈心童告诉南方周末记者。

矛盾的是，毕业论文如此重要，他们却没有正式学过该如何写论文。陈心童说，虽然分配了导师，导师也没有专门教过她。“因为刚开始写论文我真的是什么都不会，我才会用它。”她说，“也就是因为ChatGPT（我才）开始入门写论文，才能写出来。”

未来，陈心童打算考研，继续学画画。她知道硕士毕业时仍然需要完成论文，现在她认为这不是问题了，“因为我现在知道它怎么写了，我觉得写论文确实不是什么问题，无非多改几次”。她相信，即使没有ChatGPT帮助，自己也能写出来。知网上有很多论文，她可以参考别人的论文慢慢改、慢慢写。