用魔法打败魔法,南开大学最新成果让AI“识破”AI

9个月前 来源:中国新闻网 观看:92

 2Ds即热新闻——关注每天科技社会生活新变化gihot.com

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?2Ds即热新闻——关注每天科技社会生活新变化gihot.com

近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

图为AI生成内容检测示意图。(南开大学 供图)

  ?2Ds即热新闻——关注每天科技社会生活新变化gihot.com

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”2Ds即热新闻——关注每天科技社会生活新变化gihot.com

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。2Ds即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)2Ds即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-6441-0.html用魔法打败魔法,南开大学最新成果让AI“识破”AI

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:熊宇杰被提名任安徽师范大学校长

下一篇:重大突破! 青岛科技大学在《Nature》发表高水平论文

为你推荐
  大众网记者 王一刚 报道  这个冬至,让我们和艺术撞个满怀……  为全面贯彻教育部发布的《关于全面实施学校美育浸润行动的通知》,“以美育浸润学生、以美育浸润教...
01-21
作者:王欢(西安交通大学党委副书记)国无防不立,民无防不安。国防教育是建设和巩固国防的基础,是增强民族凝聚...
01-22
  三分之一董事会成员变更,净息差仅为0.93%,不良率达2.57%,遭遇盈利能力挑战的南粤银行如何自救?...
01-22
广东省人民政府1月21日印发的《关于高质量发展资本市场助力广东现代化建设的若干措施》(下称《措...
01-23
金牛座的男生通常被认为是稳重、务实和可靠的人。他们对于过日子非常重视,因此选择伴侣...
01-22
天蝎座的男生通常被认为是深沉、神秘而又充满魅力的人。他们对待感情非常认真,喜欢掌控...
01-22
婴童文案? 洛阳婴童国际儿童摄影现在叫什么?婴童文案?在生产婴童用品时厂家一定要保障产品的质量,和材质的选用,因为婴童太小,皮肤及各个器官还没长成熟,所以为了孩子健康要确保产...
02-07
男生夏季穿搭推荐? 男生夏季长裤穿搭推荐?一、男生夏季穿搭推荐?男生夏天穿搭可以很好看。因为夏天的气温高,要考虑到透气性和舒适感。一些好看的夏季着装包括T恤配休闲裤或牛仔...
02-12
2月12日消息,山西会务富农供应链管理有限公司(以下简称:山西会务富农)董事长俞爱民近日到访冷链多多,涂多多高级副总裁、物流部总监安珅,冷链多多CEO梁豪对来访人员予以接待。双方...
02-13
2月19日消息,据亿邦动力消息,拼多多APP首页已在小范围内进行改版。原来与百亿补贴频道一起并列的多多买菜退下“C位”,留下百亿补贴频道独占一整排中心位置。多多买菜现在和限...
02-20
2月26日消息,飞猪近日密集新增和更新多个类目的治理规则,进一步优化平台治理。其中包括:针对酒店、门票、租车、包车、签证、接送机等类目新增系列违规处罚场景;针对酒店拒单、...
02-26
2月28日消息,继1月发布五大举措严厉打击“幽灵外卖”后,美团外卖宣布在首页显著位置上线“明厨亮灶”专区,鼓励餐饮商家通过后厨直播的形式,全面展示食品加工过程,为消费者提供清...
03-01
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
02-09
由infiniteloop开发,费虚拟桌面宠物游戏《桌面伴侣(Desktop Mate)》的新DLC雪未来发布,冰雪装初音登场,感兴趣的玩家可以关注下了。 Desktop Mate:Steam地址 Deskto...
02-10
来自深度求索的国产AI大模型DeepSeek最近在全球走红,与此同时,各种DeepSeek“培训课程”、“赚钱课程”开始涌现。难道学习人工智能一定要付费吗,学会DeepSeek真...
02-10
据新华社报道,美国总统特朗普2月1日签署行政令,对进口自中国的商品加征10%的关税。美国的这一最新贸易保护措施在国际社会和美国国内遭到广泛反对。 商务部回应美对华加征关税...
02-02
央视网消息:据网络平台实时数据,截至2月2日13时23分,2025年度电影总票房(含预售)突破85亿元。...
02-02
随着人类探索太空的脚步迈得越来越大,在月球上,甚至在火星上驻留并建设基地成为可能。想在月球上居住和旅行,水、氧气等生存资源和交通工具就不可或缺...
01-21
《自然·医学》杂志1月21日发表的一项研究报告称,一种手术植入的脑机接口系统能通过精准侦测和解码瘫痪患者的神经元活动,转为“手指动作”,使...
01-22
  为科学、准确、全面反映海洋经济发展规模、结构等情况,近日,省自然资源厅印发《辽宁省海洋经济统计核...
02-07
春节过后我们即将迎来元宵佳节据气象部门预测今天夜间冷空气抵达辽宁沈阳东南部、鞍山中东部、抚顺、本...
02-12
▲给医患提供充分的用药选择空间,本身也是控制医疗负担的应有之义。图/IC photo据央视新闻报道,国家医保局1月20日表示,近日上海市“两会”期间,有政协委员、医学专家反映某些集...
01-21
新闻通讯员 木子春运承载着亿万游子对家乡的眷恋与期盼,春节的脚步近了,归心似箭的人们纷纷踏上返乡之路。据交通运输等部门预计,今年春运全社会跨区域人员流动量将达到90亿人...
01-22
2 月 1 日消息,东风风行宣布旗下星海S7中大型轿车新增“555 鸿运版”上市,指导价为 10.99 万元,该版本车型定位入门,整理目前东风风行星海S7 具体车型定价如下:555鸿运版...
02-02
  2月3日,生态环境部着手修改轻型汽车污染物排放限值及测量方法(中国第六阶段),《轻型汽车污染物...
02-06
  冯海宁  中国首个机器人春晚——“福蛇跃春·智向未来”嘉年华将于20日上线。届时,来自北...
01-22
随着电视剧《白色橄榄树》的热播,第38集的剧情引起了广大粉丝的关注。该剧凭借精彩的剧情、精良的制作和演员们的出色表演,赢得了观众的一致好评,收视率也位居...
02-20
21世纪经济报道记者林昀肖 北京报道1月14日,市场监管总局官网正式发布《医药企业防范商业贿赂风险合规指引》。《指引》共四章49条,其中包括...
01-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向2025年版流感诊疗方案发布1月22日,国家卫生健...
01-24
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮