用魔法打败魔法,南开大学最新成果让AI“识破”AI

2个月前 来源:中国新闻网 观看:32

 gP6即热新闻——关注每天科技社会生活新变化gihot.com

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。gP6即热新闻——关注每天科技社会生活新变化gihot.com

图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?gP6即热新闻——关注每天科技社会生活新变化gihot.com

近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。gP6即热新闻——关注每天科技社会生活新变化gihot.com

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。gP6即热新闻——关注每天科技社会生活新变化gihot.com

图为AI生成内容检测示意图。(南开大学 供图)

  ?gP6即热新闻——关注每天科技社会生活新变化gihot.com

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。gP6即热新闻——关注每天科技社会生活新变化gihot.com

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”gP6即热新闻——关注每天科技社会生活新变化gihot.com

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。gP6即热新闻——关注每天科技社会生活新变化gihot.com

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。gP6即热新闻——关注每天科技社会生活新变化gihot.com

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。gP6即热新闻——关注每天科技社会生活新变化gihot.com

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。gP6即热新闻——关注每天科技社会生活新变化gihot.com

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。gP6即热新闻——关注每天科技社会生活新变化gihot.com

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。gP6即热新闻——关注每天科技社会生活新变化gihot.com

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。gP6即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)gP6即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-6441-0.html用魔法打败魔法,南开大学最新成果让AI“识破”AI

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:熊宇杰被提名任安徽师范大学校长

下一篇:重大突破! 青岛科技大学在《Nature》发表高水平论文

为你推荐
  大众网记者 张明明 报道  11月11日至14日,由教育部高等教育司指导、中国高等教育学会主办的第四届全国高校教师教学创新大赛产教融合赛道全国赛在重庆邮电大学举行...
01-21
  2024年8月20日,我参加了北京银行西安分行和华商网童学会联合举办的“京苗小记者”研学活动,不光做了一回小记者,还体验了交通警察的生活。简直是太酷了!  早上9点20分,我...
01-21
  摘要  【骤增近30%纯碱库存创历史新高!供需失衡态势加剧?】本周,纯碱市场呈现双弱状态。纯碱...
02-07
  保险公司拿到了黄金市场的“入场券”。  2月7日,金融监管总局发布《关于开展保险资金投资...
02-13
双子座男生通常具有活泼开朗、机智聪明的性格特点。他们善于交际,喜欢与人沟通和交流,往...
01-22
天蝎座男生以其神秘、深沉的性格而闻名,他们对感情非常专一,善于保护自己和所爱的人。然...
01-22
秋季连衣裙与鞋子的完美搭配解析每当金黄色的落叶飘落,凉风乍起,我们的衣橱中总是会想起一些轻盈的连衣裙。秋天是一个适合穿着连衣裙的季节,但与之搭配的鞋子却是一个值得深思...
02-07
潮流先锋:探索海宁的MC时尚服饰当提到时尚潮流的发源地时,海宁这个名字总能令人联想到独特的设计及无可挑剔的品质。在这个城市中,MC潮流服饰以其创新的设计和精致的工艺吸引了...
02-17
成也流量,败也流量。抖音安全中心发布公告称,近期徐熙媛(大S)女士逝世引发广泛关注,广大网友纷纷表达哀思悼念,希望逝者能够安息。但也有部分账号借机炒作,发布谣言,违背公序良俗和...
02-08
2月11日消息,永辉超市日前发布了乙巳蛇年首批调改门店名单,共计20家门店,涉及15个城市。其中,包括了武汉、太原、南宁、开封、温州、东莞、绵阳和福清8个新晋调改城市,届时,调改店...
02-11
2月19日消息,京东宣布,自2025年3月1日起,京东将逐步为京东外卖全职骑手缴纳五险一金,为兼职骑手提供意外险和健康医疗险。继给快递小哥缴纳五险一金后,京东再次成为首个为外卖骑...
02-20
3月3日消息,2025年第九届亚洲冬季运动会(以下简称“亚冬会”)近日在冰雪之城哈尔滨落下帷幕。在“亚冬会”举办期间,银联商务全力保障“亚冬会”现场和周边服务的支付便利,同时推...
03-04
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
2024年12月14日 消息,杭州晓商圈网络科技有限公司(简称“晓商圈”),今日获得深圳市冠峰永越投资有限公司(简称“冠峰资本”)三千万人民币的战略投资。晓...
02-07
《狙击精英》系列最新作《狙击精英:抵抗》已于1月30日正式发售,Steam国区定价168元,豪华版268元。截至目前,该作在Steam上仅收获了698个评价,好评率也不高,仅68%,为褒...
02-03
下个月起,日本任天堂eShop和My Nintendo商店将不再接受来自外国账户的银行卡支付和PayPal支付。 任天堂今日发布这一公告,并表示做出该决定是 “为防止欺诈性使...
02-03
极目新闻记者 张扬实习生 许诺2月2日大年初五,湖北省黄冈市黄州区的安国禅寺前的广场热闹非凡。遛鸟的大爷提着竹笼在花坛边切磋鸟鸣,举着相机的游客围着青云塔转圈找角度,穿汉...
02-02
极目新闻记者 张秀娟 2月5日上午9时10分许,武汉市民之家企业开办综合办事窗口,工作人员将崭新的营业执照交至武汉国有资本投资运营集团有限公司办事人员彭艳丽的手中。这是武...
02-05
年关将至,A股进入2024业绩预告披露的密集期,半导体行业也不例外。1月15日晚,乐鑫科技(688018.SH)发布业绩预告,公司2024年年度实现营业...
01-21
荷兰特文特大学科学家开发出一种新工艺,能在室温下制造出晶体结构高度有序的半导体材料。他们表示,通过精准控制这种半导体材料的晶体结构,大幅降低了...
01-21
  【文化评析】  作者:济兼(媒体评论员)  春节申遗成功后,首个“世界非遗版”春节怎么过?文化...
01-22
今晚夜间全省晴有时多云最低气温沈阳、抚顺、本溪、阜新、辽阳、铁岭、朝阳地区和沈抚示范区零下28℃到...
01-30
  首日销售突破1.7亿 6部新片争流春节档  记者 卢扬 实习记者 刘曼华  1月19日,据灯塔专业版,2025年春节档电影开启预售,截至1月19日21时40分,档期预售总票房已突破1.7亿...
01-21
  【隔夜重磅】  美财长将启动非常措施避免债务违约  据美国财政部网站消息,美国财政部长耶伦致信美国国会称,由于美国联邦政府即将触及债务上限,财政部将从1月21日起采...
01-21
在激烈的变革时代,宝马展现了一家优秀企业的“定力”与“韧劲”。2024年,宝马集团再度夺冠中国豪华乘用车市。这一年,宝马坚守“纯粹驾驶乐趣”的品牌承诺,携手经销商伙伴提升运...
01-21
  日前,中国汽车流通协会发布的《2024年12月中国汽车保值率报告》(以下简称《报告》)显示,2024...
01-24
  苏也菲  微短剧如火如荼,“微短剧+”成为某种趋势。微短剧以其短视频体质、类似高概念电影...
01-22
《难哄》钟思乔是个什么样的角色?向朗和温以凡什么关系?‌钟思乔在《难哄》中是一个阳光积极、治愈力强的角色,她是女主角温以凡的挚友,同时也是男女主角感情的...
02-19
21世纪经济报道记者 韩利明 上海报道春节前,王晨(化名)家中未满一岁的幼儿突发咳嗽、流涕等症状。尽管卫生院就在隔壁,王晨还是选择驱车前往县...
02-02
21世纪经济报道记者 李佳英 广州报道在国家医保局宣布新一轮医保基金自查自纠工作启动后,地方医保局积极响应。2月5日,广西医保局发布《关于...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮