用魔法打败魔法,南开大学最新成果让AI“识破”AI

5个月前 来源:中国新闻网 观看:50

 ZMP即热新闻——关注每天科技社会生活新变化gihot.com

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?ZMP即热新闻——关注每天科技社会生活新变化gihot.com

近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

图为AI生成内容检测示意图。(南开大学 供图)

  ?ZMP即热新闻——关注每天科技社会生活新变化gihot.com

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”ZMP即热新闻——关注每天科技社会生活新变化gihot.com

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。ZMP即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)ZMP即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-6441-0.html用魔法打败魔法,南开大学最新成果让AI“识破”AI

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:熊宇杰被提名任安徽师范大学校长

下一篇:重大突破! 青岛科技大学在《Nature》发表高水平论文

为你推荐
据合肥工业大学新闻文化网消息,近日,合肥工业大学数学学院徐正华副教授与米兰...
01-21
作者:沈阳职业技术学院 王坤高校辅导员肩负着组织者、指导者和实施者的多重角色。在思政教育工作中,应...
01-22
    1月19日,中国地质调查发布,自然资源部中国地质调查局在甘肃安坝里北、内蒙古哈达门沟和黑...
01-21
  近日,由元保集团(以下简称“元保”)和清华大学五道口金融学院中国保险与养老金融研究中心联合...
01-22
水瓶座的男生一向以理性和独立著称,他们对于感情的态度也显得冷漠和难以捉摸。然而,当一...
01-22
天蝎座男生通常具有神秘、冷静和自信的特质,因此要成功地追求他们需要一些技巧和策略。...
01-22
长裤怎么搭配? 男士棉麻长裤搭配?一、长裤怎么搭配?1. 长裤的搭配需要根据具体的场合、季节和身材等因素来决定,总的来说,需要考虑搭配的合理性、舒适性、时尚性和个性化等方面。...
02-07
从高个子女明星看时尚与魅力:她们的独特风采如果你留意一下娱乐圈,时常会发现那些高个子女明星总是有着特别的魅力,无论是在红毯上还是日常生活中,她们的形象都能成为众人瞩目的...
02-12
2月16日消息,苏宁易采云近日先后中标多个重点项目,作为综合实物电商供应商,将充分发挥系统平台及自营供应链优势,助力政企采购更高效更便捷。其中,苏宁易采云中标江苏省政府采购...
02-17
2月17日消息,抖音电商近日发布了关于打击网络水军的治理公告,从打击虚假流量的源头入手,保障消费者体验。公告显示,2024年,该平台共清理了160万个水军账号,日均拦截水军评论超250...
02-18
2月12日,针对商标转让一事,娃哈哈回应称,目前“娃哈哈”系列商标共计387件正在国家知识产权局申请由杭州娃哈哈集团有限公司(下称“娃...
02-15
2月24日消息,Airbnb爱彼迎中国最新发布2025年春季出境游趋势报告,清明小长假作为春季出游的首个高峰节点,出境游热度较去年同期接近翻倍,日本、泰国、韩国、美国、新西兰、法国...
02-25
四维图新(002405.SZ)于1月20日晚间披露2024年业绩预告,预计营业收入34.5亿元至37亿元,较2023年营业收入增长10.51%—18.52%。在剔除非主营相关的投资收益和资产减值后,公司2...
01-21
英伟达芯片“倒爷”们,开始不发朋友圈了。2023年大模型火热的时候,“倒爷”们朋友圈的画风是“欲购从速、30%定金,有实力的老板来!”到了2024年就变成...
02-07
RTX 50系列显卡发布后,市场出现了“一卡难求”的局面,大量零售商在开售后几分钟内就宣告售罄,还有一些商家甚至根本未能拿到RTX 5090。 由于需求过高,英国零售商Ov...
02-04
英伟达最新推出的RTX 50系列显卡,特别是RTX 5090,在全球范围内都是一卡难求,在中国台湾RTX 5090显卡同样也是供不应求。 据媒体报道,在这种供不应求的情况下,黄牛...
02-06
极目新闻记者 潘锡珩4日,极目新闻记者从武汉地铁了解到,为保障铁路夜间到达乘客出行需求,今日(2月4日),武汉轨道交通2号线汉口火车站往佛祖岭方向末班车延时至24:00,4号线武汉火车站...
02-04
2025年综合运输春运工作专班数据显示,预计2025年2月9日(春运第27日,农历正月十二),全社会跨区域人员流动量20629万人次,其中,铁路客运量1330万人次,公路人员流动量18983万人次(高速公...
02-09
AI教父黄仁勋再次现身中国!1月15日,英伟达创始人兼CEO黄仁勋在深圳接受媒体采访时表示,“我是来和我的员工一起庆祝春节的,这就是我的...
01-21
美国马里兰大学医学院外科团队在异种移植领域取得一项重要进展,他们在最新一期《自然·医学》杂志上发布了关于第二例基因编辑猪心脏移植案例...
01-24
  从1月15日召开的甘肃省文物局局长会议上获悉,2024年甘肃省新增博物馆9家、累计达257家,每9.6...
01-22
  中新社北京2月12日电(记者应妮)即将在全球多个国家和地区正式上映的动画电影《哪吒之魔童闹...
02-14
  “索要千万逼死丈夫”案的翟欣欣因涉嫌犯敲诈勒索罪,案件将于今日开庭。  苏享茂的哥哥苏享龙此前也曾对外发布消息,说已接法院通知,翟欣欣涉嫌敲诈勒索一案,定于2025...
01-21
  财联社1月21日讯(编辑 牛占林)当地时间周二(1月21日),马斯克领导的美国政府效率部(DOGE)已经开始正式运作,第一项工作便是移除首席多元化官员执行委员会的网站。  该网...
01-22
1 月 21 日消息,赛力斯今日公告,预计 2024 年度实现营业收入 1442 亿元到 1467 亿元,同比上升 302.32% 到 309.30%。从公告获悉,赛力斯预计 2024 年度实现归属于上市公...
01-22
1 月 28 日消息,据 Teslarati 报道,一项由电动汽车咨询平台 Electrifying.com 开展的调查显示,特斯拉首席执行官埃隆・马斯克(Elon Musk)的言行正在影响英国消费者对特斯...
01-29
  1、《难哄》桑延是桑稚的亲哥,两人是年龄相差六岁的亲兄妹,从小打打闹闹,但兄妹感情很好。  2、桑延和桑稚生活在一个幸福有爱的家庭中,在《难哄》中白敬亭饰演桑延,桑稚...
02-14
最近,由几位优秀演员出演的电视剧《仙台有树》播出后,收视率和热度表现不俗。剧情紧凑,人物塑造生动,受到观众好评。剧中,在仙山之巅,薛冉冉成功筑基。然而,她遭遇...
02-21
  近日,中国疾控中心最新数据显示流感病毒阳性率持续上升且以甲流为主。奥司他韦和玛巴洛沙韦...
01-21
1月22日,国家卫健委、国家中医药局联合发布《流行性感冒诊疗方案(2025年版)》,新增玛巴洛沙韦、法维拉韦两种抗流感病毒药物,并明确不建议联合...
01-23
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮