用AI打败AI,毕业论文AI检测靠谱吗?
用AI打败AI,毕业论文AI检测靠谱吗?
用AI打败AI,毕业论文AI检测靠谱吗?临近毕业,为了论文达到AI率标准(biāozhǔn),有一批大学生不得不狠狠(hěnhěn)修改论文。
对于一些高校的应届毕业生而言,除了传统的查重、盲审(mángshěn)、答辩,毕业路上又多了一道(yīdào)关卡——AIGC检测。
收到学校对毕业论文进行AIGC检测的(de)(de)通知,大四学生一帆对“用AI查AI”的方式感到不放心。而检测结果让他惊讶:“虽然我自己写(xiě)的几个段落被误判为99%AI,但没想到我用AI润色的部分也被查出来(cháchūlái)了”。
利用系统(xìtǒng)改写后,他产生了好奇:“降AI也是AI写的,为什么就查不出来?”查看修改内容后,他发现“系统降AI方法就是删掉逻辑词、把很多(hěnduō)话的表述(biǎoshù)变成口水话”。
对于AI率降低后的(de)论文,他认为“论文质量反而(fǎnér)下降了,但为了合格,只能这样改。”
AI 检测再“升级”,不仅判 AI 率还(hái)能判论文质量?
论文“AI味”渐浓,是全球高校(gāoxiào)共同面对的新难题。
第三方机构麦可思(màikěsī)在2024年对3000多名中国高校师生进行的问卷调查显示,近三成大学生将AI用于论文或作业写作(xiězuò)。
2025年Open AI发布(fābù)的报告显示,“美国(měiguó)三分之一以上的大学生使用ChatGPT,他们发送的约四分之一的消息与学习和学校作业相关”,内容涵盖构思论文框架(kuāngjià)、寻找主题和拓展观点等。
2024年初,福州大学(dàxué)、中国传媒大学等高校陆续发布了毕业论文(设计)AIGC 检测的(de)通知(tōngzhī)。相比2024年,今年有更多高校将(jiāng)AIGC检测列入(lièrù)了毕业论文评价体系。西南大学、浙江科技大学、西南交通大学纷纷颁布关于2025届本科毕业论文(设计)AIGC检测的通知。
部分去年已采纳AIGC检测的高校则(zé)在今年提出了更细致的规定。以(yǐ)福州大学为例,去年的要求(yāoqiú)是“AIGC检测结果将作为学生毕业设计(论文)成绩评定和校级优秀本科生毕业设计(论文)评选参考依据(yījù)”。到今年,校方指导文件(wénjiàn)明确指出“AIGC全文检测值(jiǎncèzhí)应≤20%”,并规定终稿环节“查重检测或AIGC检测第二次才通过的论文最终总评成绩只能记作及格”。
在检测(jiǎncè)AI率的基础上,一些高校进一步采用了AI智评系统(xìtǒng),用以评判论文(lùnwén)质量。有别于拿(ná)AI率作为(zuòwéi)优秀论文参考依据,广东海洋大学、上海海事大学、温州理工学院等高校采用AI智评系统对本科毕业论文进行评级,结果包含四个等级:A(良好论文)、B(合格论文)、C(建议修改)、D(高危论文)。
这些评级(jí)意味着什么?不同的高校有着不同的标准,构成了难度不一的毕业门槛。网友(wǎngyǒu)@可回收分享自己查重定稿后,论文却被智评系统评为(píngwèi)C级,她的学校要求论文达到B级才能答辩。网友@一往无前和网友@lady luck则表示自己的学校要求C级即可(jíkě)达标。
根据(gēnjù)校方指导文件,一些高校要求学生依据AI评估的结果(jiéguǒ)对论文进一步修改。比如,广东海洋大学要求盲审前,“AI智评结果为(wèi)C或(huò)D以及检测智能生成内容比例(bǐlì)超过40%的论文,应予以修改完善”。江苏大学则将AI 论文质量评估系统给出的数值列入了检测标准,要求评估数值“原则上(yuánzéshàng)预估合格概率要高于 75%;低于 75%的,需做进一步优化和修改”。
又(yòu)贵又不稳定,大学生被AIGC检测困扰
“查了两次AI率,花了140块,太贵了。”考虑到一旦利用学校免费的查询(cháxún)次数(cìshù),论文会被计入系统成为定稿,应届生立君将论文在其他平台(píngtái)进行了检测,确保AI率稳定,“一般大家都会提前(tíqián)自费查好,我们不敢把学校的检测次数当作试错”。
区别于论文查重精确到重合的语句标识,AIGC检测以片段为(wèi)单位,这意味着修改范围扩大和不确定性(bùquèdìngxìng)增加。而面对被系统识别为“疑似AI生成”的专业术语和著作原文,不少大学生(dàxuéshēng)感到困惑。
网友@小狐狸在人间种花(zhònghuā)分享了自己的(de)毕业论文检测记录,在正文一字未改、仅添加了参考文献表和封面(fēngmiàn)的情况下,间隔两(liǎng)小时后的AI特征值从27.2%骤降为0.5%。对于花了两百块(liǎngbǎikuài)钱得到的这一波动检测结果,她感到无奈:“现在花钱查的结果也不敢相信了,好怕学校查重不过”。
评论区里,大学生(dàxuéshēng)们倾诉着类似的(de)苦恼,获得高赞的网友@来一口猫钧嘛评论称“很多自己写的都会被判(bèipàn)定AI,我的摘要写不好,最后是老师给我写的,也被判为中度AI了”;网友@圆镜表示“我连引用(yǐnyòng)的北大核心参考文献都被说是AI”。
“AI率降低(jiàngdī)后,我的论文却变味了”
目前高校采用的(de)主流(zhǔliú)检测系统在(zài)2024到2025年间先后更新。维普于(wéipǔyú)(yú)2025年2月26日完成AIGC检测更新,表示其“增强了对最新AI模型的检测效果”;知网个人查重服务系统于2025年2月13日进行了AIGC检测服务升级;格子达在2025年3月6日发布了AIGC检测3.0版本。
为了探究系统升级是否有效,澎湃新闻记者(xīnwénjìzhě)将去年《换个平台就相差 32%,AI 论文(lùnwén)检测成玄学》用于AIGC检测的(de)同一篇“完全由AI生成”的论文投入相同的高校常用(chángyòng)检测系统进行了检测。从(cóng)结果来看,部分网站识别“完全由AI生成文本”的能力有所上升,但不同网站的差异仍然明显。
“我用AI帮我翻译的英文摘要都被识别出来了”。因此,电子科学与技术专业的晨夕认为,检测系统(xìtǒng)对于AI生成内容的判断还是准确(zhǔnquè)的。但对于AI检测带来论文逻辑性减弱的后果,他感到(gǎndào)无奈。为让AI率更低,他不得不在论文中的许多(xǔduō)实验步骤前都加上了“我们(wǒmen)”,原本清晰的实验说明,变成了“我们通过……,并且我们通过……,从而我们就能(néng)得到”的赘余版本。
AI检测器的(de)误判概率(gàilǜ)大吗?一篇2024年(nián)教育(jiàoyù)技术领域的Q1级顶刊论文在检测了七款国外(guówài)主流AI检测器后发现,这些检测器对未经过改写的AI生成内容的平均识别准确率为39.5%,对于人类写作的对照样本识别准确率为67%。这意味着人类有33%的概率被误判为AI,而AI却有高于60%的概率可以蒙混过关。
在新版本发布的公告中,格子(gézi)达将其中一条区分人与AI创作的标准(biāozhǔn)描述为:人类写作存在合理的不确定性,AI生成的文本过于(guòyú)“流畅”。这也导致了大学生们的无奈:为了降低AI率,不得不把(bǎ)论文改“笨”。
网友@江枫渔火对愁眠 分享了为AI率折腰的经历,她抱着把论文修改(xiūgǎi)到(dào)最好的心态,却不得不弱化逻辑性,改书面语为口语,“虽然AI率达标了,终于定稿了,但是(dànshì)我对自己的论文不满意(mǎnyì)了,自己把自己的论文改烂真的很难受”。
网络(wǎngluò)上(shàng)也有不少经验帖分享用AI打败AI的方法(fāngfǎ),但更改(gēnggǎi)后的论文质量大打折扣。尝试过用系统降低AI率的一帆表示,AI改写的语句“不像人写的”。删减逻辑词、增加口水话后,论文与严谨、专业的大众印象渐行渐远。
采纳AI检测器,国外(guówài)高校态度审慎
除了类似“AI 检测率”这样的硬指标划定,国内一些高校也在(zài)探索(tànsuǒ)其他规范使用 AI 的方式,比如中国传媒大学继续教育学部设计了《本科毕业论文(设计)生成式人工智能使用情况(qíngkuàng)说明表》,由学生(xuéshēng)自主披露论文中的 AI 使用情况。
而使用了AI智评系统的广东海洋大学也在指导文件里(lǐ)公布了允许使用AI工具的范围,如(rú)“可用于文献检索、关键词推荐和文献管理,但需确保引用文献的真实性(zhēnshíxìng)与可靠性。可用于推荐统计图表类型和辅助制图,但不得用于生成或修改(xiūgǎi)原始研究数据及关键研究图表”。
关于AI检测器,美国前20所顶尖(dǐngjiān)高校普遍持“不(bù)建议使用”态度,考虑的主要因素(yīnsù)为现有检测技术不成熟、系统无法提供证据、误判和漏判现象频出。
Open AI公司在官网“教育者常见问题解答”中称:“我们对检测器的(de)研究表明它们并不可靠,因为教育工作者(jiàoyùgōngzuòzhě)可能会对学生作出(zuòchū)判断,并造成长期影响”。在训练过程中,其(qí)研发的AI生成内容检测器将莎士比亚的作品和《独立宣言》等人类(rénlèi)撰写的内容标记为 AI 生成。
国内主流AIGC检测平台目前并未披露具体的训练集;对于相关的大模型(móxíng)原理(yuánlǐ),公开表述也比较模糊。以维普为例(lì),其(qí)在官网对于判断标准的描述是(shì)“AIGC检测是运用AI大模型,预先对各大AIGC模型生成的海量文本数据进行特征反向演算,掌握AIGC模型文本生成的规律”。
根据同方知(fāngzhī)网数字出版技术股份有限公司2025年1月24日公布的专利《AI生成(shēngchéng)学术文本的判断(pànduàn)方法、装置(zhuāngzhì)及相关产品》,其检测系统判定原理如下:首先“利用大模型对‘待(dài)判断’学术文本进行改写 ”,再通过对比改写前后的文本,判断该学术文本是否由AI生成。
AI检测技术落后于AI生成技术的(de)现状,导致规避检测变得相对容易。上文提及的检测了(le)七款国外主流AI检测器的2024年顶刊论文还提到,即便是相对简单(jiǎndān)的内容操控(例如添加拼写错误、增加文本波动性)也能非常有效地规避检测;“具备技术敏感度、资源且有意愿的个体”则能更轻易将(jiāng)AI生成内容伪装成(wěizhuāngchéng)人类所写。这就意味着,滥用AI技术的学生并不担忧(dānyōu)检测器的考验,而(ér)手写论文的学生却可能因误判而受煎熬。
2024年12月,发表(fābiǎo)在中文核心期刊(qīkān)上的(de)(de)一篇论文《大语言模型技术背景下重塑研究生论文评价与指导》指出,高校采用“AIGC值”标准要求学生,可能容易导致师生之间陷入“猫捉老鼠”困境——“检测软件不断(bùduàn)更新换代,抄袭者随之不断寻求新的规避办法”。“学生将精力投入无意义的表达变换的文字游戏(wénzìyóuxì)中”,或许才是AIGC检测最大的隐患。
文中一帆、立君、晨夕均为(wèi)化名
澎湃新闻特约作者 何洛伊 记者 卫瑶(wèiyáo) 舒怡尔
(本文来自澎湃(pēngpài)新闻,更多原创资讯请下载“澎湃新闻”APP)
临近毕业,为了论文达到AI率标准(biāozhǔn),有一批大学生不得不狠狠(hěnhěn)修改论文。
对于一些高校的应届毕业生而言,除了传统的查重、盲审(mángshěn)、答辩,毕业路上又多了一道(yīdào)关卡——AIGC检测。
收到学校对毕业论文进行AIGC检测的(de)(de)通知,大四学生一帆对“用AI查AI”的方式感到不放心。而检测结果让他惊讶:“虽然我自己写(xiě)的几个段落被误判为99%AI,但没想到我用AI润色的部分也被查出来(cháchūlái)了”。
利用系统(xìtǒng)改写后,他产生了好奇:“降AI也是AI写的,为什么就查不出来?”查看修改内容后,他发现“系统降AI方法就是删掉逻辑词、把很多(hěnduō)话的表述(biǎoshù)变成口水话”。
对于AI率降低后的(de)论文,他认为“论文质量反而(fǎnér)下降了,但为了合格,只能这样改。”
AI 检测再“升级”,不仅判 AI 率还(hái)能判论文质量?
论文“AI味”渐浓,是全球高校(gāoxiào)共同面对的新难题。
第三方机构麦可思(màikěsī)在2024年对3000多名中国高校师生进行的问卷调查显示,近三成大学生将AI用于论文或作业写作(xiězuò)。
2025年Open AI发布(fābù)的报告显示,“美国(měiguó)三分之一以上的大学生使用ChatGPT,他们发送的约四分之一的消息与学习和学校作业相关”,内容涵盖构思论文框架(kuāngjià)、寻找主题和拓展观点等。
2024年初,福州大学(dàxué)、中国传媒大学等高校陆续发布了毕业论文(设计)AIGC 检测的(de)通知(tōngzhī)。相比2024年,今年有更多高校将(jiāng)AIGC检测列入(lièrù)了毕业论文评价体系。西南大学、浙江科技大学、西南交通大学纷纷颁布关于2025届本科毕业论文(设计)AIGC检测的通知。
部分去年已采纳AIGC检测的高校则(zé)在今年提出了更细致的规定。以(yǐ)福州大学为例,去年的要求(yāoqiú)是“AIGC检测结果将作为学生毕业设计(论文)成绩评定和校级优秀本科生毕业设计(论文)评选参考依据(yījù)”。到今年,校方指导文件(wénjiàn)明确指出“AIGC全文检测值(jiǎncèzhí)应≤20%”,并规定终稿环节“查重检测或AIGC检测第二次才通过的论文最终总评成绩只能记作及格”。
在检测(jiǎncè)AI率的基础上,一些高校进一步采用了AI智评系统(xìtǒng),用以评判论文(lùnwén)质量。有别于拿(ná)AI率作为(zuòwéi)优秀论文参考依据,广东海洋大学、上海海事大学、温州理工学院等高校采用AI智评系统对本科毕业论文进行评级,结果包含四个等级:A(良好论文)、B(合格论文)、C(建议修改)、D(高危论文)。
这些评级(jí)意味着什么?不同的高校有着不同的标准,构成了难度不一的毕业门槛。网友(wǎngyǒu)@可回收分享自己查重定稿后,论文却被智评系统评为(píngwèi)C级,她的学校要求论文达到B级才能答辩。网友@一往无前和网友@lady luck则表示自己的学校要求C级即可(jíkě)达标。
根据(gēnjù)校方指导文件,一些高校要求学生依据AI评估的结果(jiéguǒ)对论文进一步修改。比如,广东海洋大学要求盲审前,“AI智评结果为(wèi)C或(huò)D以及检测智能生成内容比例(bǐlì)超过40%的论文,应予以修改完善”。江苏大学则将AI 论文质量评估系统给出的数值列入了检测标准,要求评估数值“原则上(yuánzéshàng)预估合格概率要高于 75%;低于 75%的,需做进一步优化和修改”。
又(yòu)贵又不稳定,大学生被AIGC检测困扰
“查了两次AI率,花了140块,太贵了。”考虑到一旦利用学校免费的查询(cháxún)次数(cìshù),论文会被计入系统成为定稿,应届生立君将论文在其他平台(píngtái)进行了检测,确保AI率稳定,“一般大家都会提前(tíqián)自费查好,我们不敢把学校的检测次数当作试错”。
区别于论文查重精确到重合的语句标识,AIGC检测以片段为(wèi)单位,这意味着修改范围扩大和不确定性(bùquèdìngxìng)增加。而面对被系统识别为“疑似AI生成”的专业术语和著作原文,不少大学生(dàxuéshēng)感到困惑。
网友@小狐狸在人间种花(zhònghuā)分享了自己的(de)毕业论文检测记录,在正文一字未改、仅添加了参考文献表和封面(fēngmiàn)的情况下,间隔两(liǎng)小时后的AI特征值从27.2%骤降为0.5%。对于花了两百块(liǎngbǎikuài)钱得到的这一波动检测结果,她感到无奈:“现在花钱查的结果也不敢相信了,好怕学校查重不过”。
评论区里,大学生(dàxuéshēng)们倾诉着类似的(de)苦恼,获得高赞的网友@来一口猫钧嘛评论称“很多自己写的都会被判(bèipàn)定AI,我的摘要写不好,最后是老师给我写的,也被判为中度AI了”;网友@圆镜表示“我连引用(yǐnyòng)的北大核心参考文献都被说是AI”。
“AI率降低(jiàngdī)后,我的论文却变味了”
目前高校采用的(de)主流(zhǔliú)检测系统在(zài)2024到2025年间先后更新。维普于(wéipǔyú)(yú)2025年2月26日完成AIGC检测更新,表示其“增强了对最新AI模型的检测效果”;知网个人查重服务系统于2025年2月13日进行了AIGC检测服务升级;格子达在2025年3月6日发布了AIGC检测3.0版本。
为了探究系统升级是否有效,澎湃新闻记者(xīnwénjìzhě)将去年《换个平台就相差 32%,AI 论文(lùnwén)检测成玄学》用于AIGC检测的(de)同一篇“完全由AI生成”的论文投入相同的高校常用(chángyòng)检测系统进行了检测。从(cóng)结果来看,部分网站识别“完全由AI生成文本”的能力有所上升,但不同网站的差异仍然明显。
“我用AI帮我翻译的英文摘要都被识别出来了”。因此,电子科学与技术专业的晨夕认为,检测系统(xìtǒng)对于AI生成内容的判断还是准确(zhǔnquè)的。但对于AI检测带来论文逻辑性减弱的后果,他感到(gǎndào)无奈。为让AI率更低,他不得不在论文中的许多(xǔduō)实验步骤前都加上了“我们(wǒmen)”,原本清晰的实验说明,变成了“我们通过……,并且我们通过……,从而我们就能(néng)得到”的赘余版本。
AI检测器的(de)误判概率(gàilǜ)大吗?一篇2024年(nián)教育(jiàoyù)技术领域的Q1级顶刊论文在检测了七款国外(guówài)主流AI检测器后发现,这些检测器对未经过改写的AI生成内容的平均识别准确率为39.5%,对于人类写作的对照样本识别准确率为67%。这意味着人类有33%的概率被误判为AI,而AI却有高于60%的概率可以蒙混过关。
在新版本发布的公告中,格子(gézi)达将其中一条区分人与AI创作的标准(biāozhǔn)描述为:人类写作存在合理的不确定性,AI生成的文本过于(guòyú)“流畅”。这也导致了大学生们的无奈:为了降低AI率,不得不把(bǎ)论文改“笨”。
网友@江枫渔火对愁眠 分享了为AI率折腰的经历,她抱着把论文修改(xiūgǎi)到(dào)最好的心态,却不得不弱化逻辑性,改书面语为口语,“虽然AI率达标了,终于定稿了,但是(dànshì)我对自己的论文不满意(mǎnyì)了,自己把自己的论文改烂真的很难受”。
网络(wǎngluò)上(shàng)也有不少经验帖分享用AI打败AI的方法(fāngfǎ),但更改(gēnggǎi)后的论文质量大打折扣。尝试过用系统降低AI率的一帆表示,AI改写的语句“不像人写的”。删减逻辑词、增加口水话后,论文与严谨、专业的大众印象渐行渐远。
采纳AI检测器,国外(guówài)高校态度审慎
除了类似“AI 检测率”这样的硬指标划定,国内一些高校也在(zài)探索(tànsuǒ)其他规范使用 AI 的方式,比如中国传媒大学继续教育学部设计了《本科毕业论文(设计)生成式人工智能使用情况(qíngkuàng)说明表》,由学生(xuéshēng)自主披露论文中的 AI 使用情况。
而使用了AI智评系统的广东海洋大学也在指导文件里(lǐ)公布了允许使用AI工具的范围,如(rú)“可用于文献检索、关键词推荐和文献管理,但需确保引用文献的真实性(zhēnshíxìng)与可靠性。可用于推荐统计图表类型和辅助制图,但不得用于生成或修改(xiūgǎi)原始研究数据及关键研究图表”。
关于AI检测器,美国前20所顶尖(dǐngjiān)高校普遍持“不(bù)建议使用”态度,考虑的主要因素(yīnsù)为现有检测技术不成熟、系统无法提供证据、误判和漏判现象频出。
Open AI公司在官网“教育者常见问题解答”中称:“我们对检测器的(de)研究表明它们并不可靠,因为教育工作者(jiàoyùgōngzuòzhě)可能会对学生作出(zuòchū)判断,并造成长期影响”。在训练过程中,其(qí)研发的AI生成内容检测器将莎士比亚的作品和《独立宣言》等人类(rénlèi)撰写的内容标记为 AI 生成。
国内主流AIGC检测平台目前并未披露具体的训练集;对于相关的大模型(móxíng)原理(yuánlǐ),公开表述也比较模糊。以维普为例(lì),其(qí)在官网对于判断标准的描述是(shì)“AIGC检测是运用AI大模型,预先对各大AIGC模型生成的海量文本数据进行特征反向演算,掌握AIGC模型文本生成的规律”。
根据同方知(fāngzhī)网数字出版技术股份有限公司2025年1月24日公布的专利《AI生成(shēngchéng)学术文本的判断(pànduàn)方法、装置(zhuāngzhì)及相关产品》,其检测系统判定原理如下:首先“利用大模型对‘待(dài)判断’学术文本进行改写 ”,再通过对比改写前后的文本,判断该学术文本是否由AI生成。
AI检测技术落后于AI生成技术的(de)现状,导致规避检测变得相对容易。上文提及的检测了(le)七款国外主流AI检测器的2024年顶刊论文还提到,即便是相对简单(jiǎndān)的内容操控(例如添加拼写错误、增加文本波动性)也能非常有效地规避检测;“具备技术敏感度、资源且有意愿的个体”则能更轻易将(jiāng)AI生成内容伪装成(wěizhuāngchéng)人类所写。这就意味着,滥用AI技术的学生并不担忧(dānyōu)检测器的考验,而(ér)手写论文的学生却可能因误判而受煎熬。
2024年12月,发表(fābiǎo)在中文核心期刊(qīkān)上的(de)(de)一篇论文《大语言模型技术背景下重塑研究生论文评价与指导》指出,高校采用“AIGC值”标准要求学生,可能容易导致师生之间陷入“猫捉老鼠”困境——“检测软件不断(bùduàn)更新换代,抄袭者随之不断寻求新的规避办法”。“学生将精力投入无意义的表达变换的文字游戏(wénzìyóuxì)中”,或许才是AIGC检测最大的隐患。
文中一帆、立君、晨夕均为(wèi)化名
澎湃新闻特约作者 何洛伊 记者 卫瑶(wèiyáo) 舒怡尔
(本文来自澎湃(pēngpài)新闻,更多原创资讯请下载“澎湃新闻”APP)





相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎