用魔法打败魔法,南开大学最新成果让AI“识破”AI

8个月前 来源:中国新闻网 观看:79

 M5r即热新闻——关注每天科技社会生活新变化gihot.com

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。M5r即热新闻——关注每天科技社会生活新变化gihot.com

图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?M5r即热新闻——关注每天科技社会生活新变化gihot.com

近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。M5r即热新闻——关注每天科技社会生活新变化gihot.com

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。M5r即热新闻——关注每天科技社会生活新变化gihot.com

图为AI生成内容检测示意图。(南开大学 供图)

  ?M5r即热新闻——关注每天科技社会生活新变化gihot.com

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。M5r即热新闻——关注每天科技社会生活新变化gihot.com

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”M5r即热新闻——关注每天科技社会生活新变化gihot.com

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。M5r即热新闻——关注每天科技社会生活新变化gihot.com

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。M5r即热新闻——关注每天科技社会生活新变化gihot.com

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。M5r即热新闻——关注每天科技社会生活新变化gihot.com

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。M5r即热新闻——关注每天科技社会生活新变化gihot.com

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。M5r即热新闻——关注每天科技社会生活新变化gihot.com

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。M5r即热新闻——关注每天科技社会生活新变化gihot.com

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。M5r即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)M5r即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-6441-0.html用魔法打败魔法,南开大学最新成果让AI“识破”AI

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:熊宇杰被提名任安徽师范大学校长

下一篇:重大突破! 青岛科技大学在《Nature》发表高水平论文

为你推荐
  大众网记者 秦瑾 通讯员 祁凯丽 报道  12月20日,章丘区大中小学思政课一体化协同创新联盟成立暨大中小学思政课教学展示活动在齐鲁师范学院附属中学(章丘中学)报告厅...
01-21
1月17日下午2点,东北大学2024创业项目座谈交流会暨第十九批(2025年)创业类项目实施培训会在东北大学南湖校...
01-21
  原标题:中铁信托因股东损害公司债权人利益责任纠纷被告,5月27日在成都市武侯区人民法院审理 ...
01-22
  随着春节临近,银行理财子公司再掀“降费潮”。  1月23日,光大理财在官网发布多条公告,将对旗...
01-24
射手男是一个热爱自由、追求刺激的星座,他们喜欢冒险和探索未知的领域。因此,对于射手男...
01-22
天秤座的人是非常注重平衡和公正的,他们追求和谐的关系,并且希望能够与自己喜欢的人建立...
01-22
璀璨舞台:模特T台走秀大赛精彩主持稿亲爱的观众们,大家好!今天我们齐聚一堂,欢迎来到精彩绝伦的模特T台走秀大赛现场。我是今天的主持人[姓名],倍感荣幸能与大家一同分享这场时尚...
02-12
独特魅力:韩国牛仔裤模特精彩T台走秀每年的时尚周总是让人期待不已,尤其是那些展现出独特风格的服装秀。我记得第一次观看韩国牛仔裤模特的T台走秀时,那种体验简直酣畅淋漓。牛...
02-17
2月13日消息,苏宁易购宣布全面启动“6000元以上手机补贴计划”,2月14日至3月16日期间,针对6000元以上机型追加250-1000元补贴,每人限购一台,苏宁易购全国直营店可用。2月14日零点...
02-14
2月16日消息,淘宝香港站近日宣布与一站式家居维修平台Papabo达成合作,将在信和集团旗下尖沙咀中港城开设“PapaHome淘宝家具实体店”,计划于2月22日开业,首阶段营运面积超过2.5...
02-17
新年伊始,知名少儿编程教育机构——童程童美因财务危机爆雷,全国各地多校区陷入经营困境。此前,《消费者报道》曾在1月17日刊发的《...
02-11
2月22日消息,第十四届公益节暨2024ESG影响力年会奖项评选结果近日正式公布,享道出行申报的“请帮我回家”项目摘得“2024年度公益项目奖”。“请帮我回家”是享道出行聚焦儿童...
02-23
近年来,随着资本市场不断深化,中小基金公司凭借灵活的经营策略和专业的投资管理能力,逐步挺进基金行业发展的前列。  最新披露的基金四季报数据显示,众多中小基金公司的公...
01-23
2024国庆长假第一天,北京奥林匹克公园人头攒动,往来如织的人群中一道道“奇装异服”的身影吸引了游客注目,银发雪衣的雪女,斗笠披风的侠客,长尾兽耳的萌娘,子衿青青的儒生……原来...
01-23
一个好的肉鸽游戏可以是忙里偷闲的一份放松,令人重燃干劲;可以在深夜抚慰一个打工人焦躁不安的灵魂,让人安然入睡,也可以是...味大,无需多盐。总之,这个世界需要更多...
01-25
《漫威蜘蛛侠2》PC版将于1月31日发售。近日索尼公布了该作PC配置需求,并详细介绍了其光线追踪功能,一起来看看吧! Steam商店地址:点击进入 全新预告: 《漫威蜘蛛...
01-30
极目新闻记者 陈凌燕绘图 刘阳嗖地一下,年过完了。那么问题来了,说了那么多“新年快乐”,么样才能过好2025年?莫焦燥学会慢点嘎,冇得事嘀嘀嗒:我今年有个重要的计划,我要学会慢下来...
02-06
在上海交通大学闵行校园的西区,旭华路是一条几乎贯穿南北的道路。开学时节,这几乎是全校最热闹的道路之一,沿旭华路一路穿行,会经过学生宿舍、体育场、用餐区、快递区、活动场馆...
02-08
近日,两家独角兽的朋友圈“论战”在近期引起了多方关注。争议缘起于一张影石创始人怒喷友商的截图。在微信朋友圈界面中,显示为“刘...
01-21
1月13日,由浙江大学杭州国际科创中心(以下简称“科创中心”)人形机器人创新研究院联合镜识科技有限公司、杭州凯达尔焊接机器人股份有限公司研发的四...
01-21
  作者:本报记者鲁元珍《光明日报》(2025年02月06日15版)  到北方冰雪世界感受银装素裹的美景,...
02-07
  今年计划换新车的辽宁消费者迎来利好。2月13日晚,辽宁省商务厅发布通知,明确了今年辽宁落实国家汽车...
02-14
  随着中美网友在小红书热络交流  交完“猫税”的外国朋友  开始唤起很多人学生时代的记忆了  英语试卷里  当年那些学生以“李华”口吻写的信  如今真的收...
01-21
坐拥我国西南方向出海口,广西却长期被戏称为“假的沿海省份”。 其原因在于,广西主要几条大江,漓江、邕江、柳江等在梧州汇成西江,最...
01-21
1 月 23 日消息,小鹏汽车昨晚正式推送AI 天玑 5.5.0,支持“车位到车位”(先锋版),并对智驾功能进行了多项优化。整理如下:“车位到车位”(先锋版):地库、闸机、园区、城市道...
01-23
2 月 7 日消息,汽车媒体 carscoops 今天(2 月 7 日)发布博文,报道称斯巴鲁(Subaru)扩展旗下 FORESTER 森林人 SUV,计划今年夏季推出全新混合动力版本和 Wilderness 越野版...
02-07
  胡建礼  系列电影的创作并非易事,绝非简单复制。续集既要保持与前作IP风格和元素的连贯性,...
02-18
最近风靡的《痞子无间道》凭借演员们的颜值、演技以及引人入胜的剧情吸引了大量观众。这部剧集不仅情节扣人心弦,人物塑造生动,还包含许多精彩的场景和细节,引...
02-19
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向今年的医保目录调整时间将提前1月17日,国家医...
01-21
  美国宾夕法尼亚大学科学家绘制出了迄今最完整、最详细的肾功能遗传图谱,发现1000多个基因有...
02-14
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮