用魔法打败魔法,南开大学最新成果让AI“识破”AI

1周前 来源:中国新闻网 观看:4

 Azo即热新闻——关注每天科技社会生活新变化gihot.com

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。Azo即热新闻——关注每天科技社会生活新变化gihot.com

图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?Azo即热新闻——关注每天科技社会生活新变化gihot.com

近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。Azo即热新闻——关注每天科技社会生活新变化gihot.com

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。Azo即热新闻——关注每天科技社会生活新变化gihot.com

图为AI生成内容检测示意图。(南开大学 供图)

  ?Azo即热新闻——关注每天科技社会生活新变化gihot.com

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。Azo即热新闻——关注每天科技社会生活新变化gihot.com

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”Azo即热新闻——关注每天科技社会生活新变化gihot.com

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。Azo即热新闻——关注每天科技社会生活新变化gihot.com

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。Azo即热新闻——关注每天科技社会生活新变化gihot.com

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。Azo即热新闻——关注每天科技社会生活新变化gihot.com

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。Azo即热新闻——关注每天科技社会生活新变化gihot.com

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。Azo即热新闻——关注每天科技社会生活新变化gihot.com

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。Azo即热新闻——关注每天科技社会生活新变化gihot.com

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。Azo即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)Azo即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-6441-0.html用魔法打败魔法,南开大学最新成果让AI“识破”AI

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:熊宇杰被提名任安徽师范大学校长

下一篇:重大突破! 青岛科技大学在《Nature》发表高水平论文

为你推荐
人民网北京11月11日电 (记者孙竞、李依环)教育部今天举行新闻发布会,就新出台的《中华人民共和国学前教育...
01-21
作者:中共大连经济技术开发区中等职业技术专业学校总支委员会委员 行政二支部书记 白雪习近平总书记指出...
01-22
  三分之一董事会成员变更,净息差仅为0.93%,不良率达2.57%,遭遇盈利能力挑战的南粤银行如何自救?...
01-22
  中国网财经2月8日讯 日前,国家金融监督管理总局上海监管局核准高建辉中海信托股份有限公司总...
02-11
双鱼座的男生通常都是非常浪漫和敏感的,他们对待爱情充满了幻想和渴望。如果你发现身边...
01-22
天蝎座的男生通常以冷静、深沉而闻名。当他们遇到问题或者感到困惑时,他们往往需要一段...
01-22
短款衬衫裙子怎么搭配?一、短款衬衫裙子怎么搭配?搭配方案一:白衬衫+黑色A字褶裙伞形裙摆,细高腰的A字褶裙处处都散发着复古优雅女人味,搭配白衬衫,仿佛又回到赫本的熟女年代,加之...
02-12
穿越时尚潮流前线:2023年必备服饰推荐当我们谈到时尚潮流,总会感叹于其迅猛变化和多元风格。从熙熙攘攘的时装周到各大品牌的发布秀,时尚似乎从未停止过它的步伐。但如何在瞬息...
02-12
2月6日消息,抖音电商规则中心更新了调整保证金和“0元入驻”的新规则:降低34个一级类目商家的保证金,最高降幅达85%;同时首次大批量开放1345 个子类目“0元入驻”,减少新商家的入...
02-07
张一鸣:“做不好的就别做了,要做就必须做到非常好。”1.抖音电商跃居行业第三2024年,电商市场步入存量时代,竞争愈发白热化。那么,经过一整年的激烈厮杀,电商平台们的表现如何呢?据...
02-18
图源:喜茶官网 喜茶的一封全员内部信,打响了2025年新茶饮行...
02-11
2月27日消息,京东外卖宣布推出“10元/20元餐补随机领”优惠活动,用户每晚8点即可随机领取“满15元减10元”“满40元减20元”两种大额餐补优惠券,首批覆盖通过京东认证的大学生...
03-01
【#吉利旗下极光湾在上海成立汽车零部件公司# 注册资本2000万】天眼查App显示,1月20日,上海极光湾汽车零部件有限公司成立,法定代表人为WANG RUI PING,注册资本2000万人民币,经营...
01-21
近日,南京众智维信息科技有限公司(以下简称“「众智维科技」”)完成数千万B1轮融资。本轮融资由广州白云金融控股集团有限公司及北京泓沣私募基金管...
02-07
玩家们经常将《漫威争锋》与《守望先锋2》相比较,多数人认为《漫威争锋》比《守望先锋2》更有趣好玩。《漫威争锋》上线后,其Steam玩家数不断攀升,而《守望先锋2...
02-03
华纳兄弟游戏近日宣布,旗下推出不久的实时服务大乱斗格斗游戏《华纳大乱斗》即将在最后一个赛季,第五赛季之后关服。虽然在这之后仍然可以离线游玩,但游戏的网络...
02-04
极目新闻通讯员 凌丽万“巳”大“集”闹新春,非遗技艺过大年。2月3日,正月初六,又恰逢二十四节气之首“立春”,为庆祝首个“非遗版”春节,弘扬中华优秀传统文化,寄托岁首美好期盼,...
02-04
2月4日,据报道,《封神2》太原路演现场观众情绪失控,导演乌尔善被观众贴脸质问: “为什么封神的口碑两极分化,你想过没有? 我们作为路人一直在给你说好话,你有没有想过自己去解决这...
02-05
1月15日,记者从中国科学院大连化学物理研究所获悉,该所动力电池与系统研究中心主任陈忠伟团队与双登集团近日对外联合发布了最新一代智能电池管理系...
01-21
  新华社北京1月17日电 题:记者手记:以投融资改革为水利发展增添“活水”  新华社记者魏弘毅  松软...
01-21
  撒欢、尖叫、上厕所、要零食……高铁上,孩子一刻不停歇的场景很多人都体验过,让想安静休息的...
02-11
新闻记者 康旭阳 通讯员 沈商轩实习生 何世银1月21日,全国手机、平板、智能手表(手环)购新补贴政策实施暨“年在荆楚 巳巳如意”湖北新春消费季启动仪式在武汉举行。新闻记者获...
01-22
新闻通讯员 木子春运承载着亿万游子对家乡的眷恋与期盼,春节的脚步近了,归心似箭的人们纷纷踏上返乡之路。据交通运输等部门预计,今年春运全社会跨区域人员流动量将达到90亿人...
01-22
[本站 资讯] 日前,我们从官方获悉,捷达VA7将会在明日(1月12日)正式上市,车辆定位国民家轿,是一款紧凑型车,使用1.4T动力,此前预售价为11.8777万元起。在上个月,捷达VA7就完成...
01-21
1 月 30 日消息,东风启辰现已发布了旗下2025款启辰大 V DD-i 超混动SUV官图,该车主要在外观及动力系统方面进行调整。作为比较,现款在售2023款启辰大 V DD-i车型定价为...
01-31
  1、《树下有片红房子》自2月15日开始在腾讯视频全网独播,腾讯会员首更四集,连更七天,周日到周三每天更新两集,周四和周五每天更新一集。  2、腾讯暂时只出了前七天的追剧...
02-18
最新播出的《仙台有树》收获了观众的一致好评。薛冉冉在剧中的表白引起了大家的兴趣,以下是对这一情节的分析。《仙台有树》的故事扣人心弦,薛冉冉和苏易水之...
02-19
  本报北京1月13日电 (记者孙秀艳)为进一步加大对创新药的支持力度,国家医保局将研究出台一系列更有力度的政策举措。  国家医保局近日召开支持创新药发展企业座谈...
01-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家药监局出台新规支持化妆品原料创新 2月6...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮