毕业季的到来,高校面临着论文中“AI 味”过浓的新挑战。除了传统的查重、盲审和答辩,今年的毕业生们还需经历一道名为 AIGC 检测(人工智能生成内容检测)的环节。
设想一名毕业生,其论文的 AI 含量被检测出为 62%,远超学校设定的 15% 红线。当他向一个大型语言模型输入“请将这篇论文改写得更像人类所写”并完成修改后,再次检测发现 AI 率竟飙升至 94%。这种情况并非孤例,近期已有不少毕业生遭遇类似困境。
央视新闻近日介绍了检测论文“AI 率”的原理。首都师范大学教育学院副院长蔡海龙解释道,传统的查重是将论文语句与语料库进行比对,以确定重复性并作出确定性判断。而 AI 检测则是利用 AI 系统来分析人类文本,判断其在语义和表达风格上是否与 AI 写作存在重叠,其本质是一种基于概率的分类,而非基于证据的确定性判断。
当前 AI 检测技术的核心瓶颈在于“以 AI 查 AI”,这使得明确区分人类作者与 AI 所写文本变得困难,也阻碍了做出清晰的解释和说明,这是技术上最关键的难题。
此外,中文语言表达的丰富性,包括语义的多元和语句表达方式的多样,给人工智能系统检测人类作者的写作带来了显著的歧义,增加了难度并影响了准确率,这也是导致误判的重要原因。
鉴于目前 AI 率检测的精准度仍有待提高,教育界人士建议,在论文审核过程中,应建立透明且可追溯的 AI 使用标注制度,而非简单设定 AI 率的“红线”。在判定机制上,应优先考虑以人工评审为主,AI 检测为辅的“人机共判”模式。
尽管学校为学生论文设置了“AI 率”检测红线,但不少学生反映,学校的 AI 率检查依赖于指定的检测平台,并通过算法模型进行分析。
目前,国内主流高校普遍采用知网、维普、万方等系统的 AIGC 检测模块。当央视记者就“AI 大模型如何检测文章 AI 生成内容”向多个大模型提问时,它们总结的判断依据主要包括“困惑度”和“突发性”等特征。AI 生成的文本通常更为“平滑”,而人类文本则表现出更大的波动性。
大模型解释说,“困惑度”指的是文本的“可预测性”,人类特有的、出人意料的、非常规的表达越多,文本就越像人类所写。“突发性”则关乎文本的节奏波动,人类写作如同心电图般起伏不定,而 AI 输出则相对平稳,如同直线。那么,这种判断方式是否准确呢?
专家对此表示,除了困惑度、突发性等指标外,AI 文本生成是通过预测下一个最有可能出现的词的概率来逐步构建的,这本质上是一种概率统计。因此,目前对 AI 生成内容的检测准确性无法达到 100%,误判的情况也时有发生。

世界杯下注深耕世界杯赔率领域,用心服务每一位用户。
世界杯下注专注世界杯竞猜,为用户提供专业可靠的体验。