用魔法打败魔法,南开大学最新成果让AI“识破”AI

6个月前 来源:中国新闻网 观看:65

 7Q7即热新闻——关注每天科技社会生活新变化gihot.com

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?7Q7即热新闻——关注每天科技社会生活新变化gihot.com

近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

图为AI生成内容检测示意图。(南开大学 供图)

  ?7Q7即热新闻——关注每天科技社会生活新变化gihot.com

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”7Q7即热新闻——关注每天科技社会生活新变化gihot.com

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。7Q7即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)7Q7即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-6441-0.html用魔法打败魔法,南开大学最新成果让AI“识破”AI

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:熊宇杰被提名任安徽师范大学校长

下一篇:重大突破! 青岛科技大学在《Nature》发表高水平论文

为你推荐
建设教育强国,龙头是高等教育。近日印发的《教育强国建设规划纲要(2024&mdas...
01-21
编译丨刘玉洁 赵广立 美国密歇根州的贝克学院(Baker College)是一所有百...
01-21
  乌鲁木齐银行第三大股东深圳君豪集团有限公司所持有的4000万股股权即将于1月18日进行司法拍...
01-22
  原标题:又见共管保险箱被撬!浙金信托一产品爆雷后被监管认定存在四大问题  来源:界面新闻 ...
01-28
水瓶座的男生通常被认为是聪明、独立和有点神秘的人。他们喜欢自由和独处的时间,所以在...
01-22
巨蟹座的人通常被认为是温柔、体贴和善良的,他们对待感情非常认真。然而,有时候即使是最...
01-22
掀起潮流风暴:深入探讨潮流文化与服饰的融合潮流文化是一种与时尚密切相关的现象,它不仅影响着人们的穿着打扮,还渗透到生活的各个角落。在这个快速变化的时代,每一季的新趋势都...
02-12
瘦小的男人适合穿什么品牌?一、瘦小的男人适合穿什么品牌?没有特定的品牌适合瘦小的男人,关键是要选择适合自己身材和风格的衣服。因为每个人的身材和个性都不同,选择品牌只是其...
02-17
2月12日消息,据复旦消费大数据实验室数据,网上年货节期间(1月7日至2月5日)广州市网上零售总额达956.4亿元,相比去年同期增长4.58%。各大电商平台推出丰富多彩的活动优惠,实现销售...
02-13
与其被动防守,不如主动出击。近年来,随着各行业竞争日趋白热化,内卷现象不断加剧。面对生存压力,互联网巨头们在巩固核心业务的同时,愈发迫切地需要拓展多元化布局。这一战略转...
02-18
中国火锅品牌正在逐步打开中东市场的大门。近年来,刘一手、海底捞、小龙坎、哥老官等在中国各城市常见的连锁火锅品牌,纷纷进入中东...
03-01
3月1日消息,在北京大学国家发展研究院【承泽论坛】第32期,智联招聘集团总裁张月佳指出,在数字技术的加持下,更多职场人有机会成为“超级个体”,而HR是寻找与培养超级个体的关键。...
03-01
2025年,中国“HR SaaS第一股”给资本市场带来一些震撼。据北森港股公告,1月14日,北森境内控股公司与企业培训平台“酷学院”股东订立境内股权转让协...
02-07
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
已经登陆多平台的奇幻背景建造主题RPG游戏《神箱 - Mythology of Cube -》(日版)官方宣布将推出国际版,预定1月30日登陆Steam、PlayStation5/4、Nintendo Switch平...
01-24
据法国媒体报道Les Echos报道,育碧和沙特公司Savvy Games Group达成合作关系,这可能让发售两年的《刺客信条:幻景》迎来DLC。 报道称育碧之前对《刺客信条:幻景》...
01-27
抖音安全中心2月8日公告称,近期,徐熙媛(大S)女士逝世引发广泛关注,广大网友纷纷表达哀思悼念,希望逝者能够安息。但也有部分账号借机炒作,发布谣言,违背公序良俗和道德底线,不尊重逝...
02-08
2月9日是哈尔滨亚冬会开幕后的第二个比赛日,中国代表团以15金15银14铜继续领跑奖牌榜。在滑雪登山女子短距离、滑雪登山男子短距离、越野滑雪女子5公里(自由技术)、自由式滑雪...
02-10
  科技日报记者 刘霞  据物理学家组织网15日报道,美国劳伦斯·利弗莫尔国家实验室(LLNL)科学家...
01-21
1月14日,记者从国家市场监管总局获悉,该局近日在国际上率先批准新建微波亮温度国家计量基准,该计量基准有利于解决射电天文、行星探索等领域微波亮温...
01-21
  近日,省商务厅发布《辽宁省手机、平板、智能手表(手环)购新补贴实施细则》(以下简称《实施细则》),明确补...
01-22
  随着假期的收官,各地春节旅游“成绩单”相继出炉。北京凭借入境游、庙会游、冰雪游的持续升...
02-07
中新社香港1月21日电 国泰集团21日公布数据显示,2024年,国泰航空及香港快运全年共载客逾2800万人次,同比上升30.7%;国泰货运全年共运载150万吨货物,同比增长11%。据统计,2024年12...
01-22
  中新经纬1月21日电 题:智能化引领,AI家电与低空经济“共舞”  作者 朱克力 中国信息协会常务理事、国研新经济研究院创始院长  2024年来,以旧换新政策在家电消费领域掀...
01-21
1 月 26 日消息,GM Authority 披露了雪佛兰将在海外市场推出的全新车型“Spark”的实车图。该车定位小型电动跨界车,名为 Spark EUV,实质上是国内宝骏悦也 Plus 的海外...
01-27
1 月 26 日消息,日前特斯拉 Autopilot 高级软件工程师 Phil Duan 针对用户对特斯拉 FSD 技术的质疑作出回应,暗示公司在该领域取得了显著进展。一位长期持有特斯拉股...
01-27
最近,《我的蛇君软又妖》吸引了众多观众的目光,播出后引发了广泛关注。社交媒体上频繁出现关于该剧的讨论和剧情分析,特别是其剧情介绍,激发了观众浓厚的兴趣和...
02-20
  记者 师悦  《哪吒之魔童闹海》热度节节攀升,相关电影周边也卖断了货,可谓一“吒”难求。非...
02-22
  记者1日从国家卫生健康委获悉,2025年至2027年被确定为“儿科和精神卫生服务年”,同时,国家卫生健康委公布了2025年全系统为民服务的八件实事。  据介绍,在2025年至2...
01-21
21世纪经济报道记者 唐唯珂 广州报道Deepseek持续搅动全球AI格局重塑之下,应用产业端连锁反应也在深入。在医疗端应用展开的讨论同样热闹。...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮