数据“中毒”会让AI“自己学坏”

10个月前 来源:新华网 观看:92

在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干扰,比如用一束红色激光模拟列车尾灯,那么摄像头可能会误以为轨道上已有列车。久而久之,AI学会了把这种假象当作真实信号,并不断发出“轨道占用”的错误提示。最终,不仅列车调度被打乱,甚至还可能酿成安全事故。6ha即热新闻——关注每天科技社会生活新变化gihot.com

澳大利亚《对话》杂志日前报道称,这是数据“中毒”的一个非常典型的例子。AI系统在学习过程中,如果输入了错误或误导性数据,可能会逐渐形成错误认知,作出偏离预期的判断。与传统的黑客入侵不同,数据“中毒”不会直接破坏系统,而是让AI“自己学坏”。随着AI在交通、医疗、媒体等领域的普及,这一问题正引起越来越多的关注。6ha即热新闻——关注每天科技社会生活新变化gihot.com

AI“中毒”的现实风险6ha即热新闻——关注每天科技社会生活新变化gihot.com

在火车站的例子中,假设一个技术娴熟的攻击者既想扰乱公共交通,又想收集情报,他连续30天用红色激光欺骗摄像头。如果未被发现,这类攻击会逐渐腐蚀系统,为后门植入、数据窃取甚至间谍行为埋下隐患。虽然物理基础设施中的数据投毒较为罕见,但线上系统,尤其是依赖社交媒体和网页内容训练的大语言模型中,它已是重大隐患。6ha即热新闻——关注每天科技社会生活新变化gihot.com

一个著名的数据“投毒”案例发生在2016年,微软推出的聊天机器人Tay上线数小时后,就被恶意用户灌输不当言论,迅速模仿并发布到X(当时的Twitter)平台上,不到24小时就被迫下线并道歉。6ha即热新闻——关注每天科技社会生活新变化gihot.com

据英国《新科学家》杂志报道,2024年,互联网出现了一个标志性事件,即AI爬虫的流量首次超过人类用户,其中OpenAI的ChatGPT-User占据了全球6%的网页访问量,它本质上是ChatGPT的“上网代理”,在用户需要实时信息时替他们访问网站。而Anthropic的ClaudeBot更是长期大规模抓取网页内容,占到13%的流量。6ha即热新闻——关注每天科技社会生活新变化gihot.com

互联网上的大量内容正被AI模型不断采集、吸收,用于持续训练。一旦有人故意投放有毒数据,比如篡改的版权材料、伪造的新闻信息,这些大规模采集的爬虫就可能把它们带进模型,造成版权侵权、虚假信息扩散,甚至在关键领域引发安全风险。6ha即热新闻——关注每天科技社会生活新变化gihot.com

版权之争中的“投毒”反击6ha即热新闻——关注每天科技社会生活新变化gihot.com

随着AI爬虫的大规模抓取,许多创作者担心作品被未经许可使用。为了保护版权,创作者采取了法律和技术手段。如《纽约时报》起诉OpenAI,称其新闻报道被模型学习再利用,侵犯了版权。6ha即热新闻——关注每天科技社会生活新变化gihot.com

面对旷日持久的版权拉锯战,一些创作者转向技术“自卫”。美国芝加哥大学团队研发了两款工具。名为Glaze的工具可在艺术作品中加入微小的像素级干扰,让AI模型误以为一幅水彩画是油画。另一款工具Nightshade更为激进,它能在看似正常的猫的图片中植入隐蔽特征,从而让模型学到“猫=狗”这样的错误对应。通过这种方式,艺术家们让自己的作品在训练数据中成为“毒药”,保护了原创风格不被复制。6ha即热新闻——关注每天科技社会生活新变化gihot.com

这种反击方式一度在创作者群体中风靡。Nightshade发布不到一年,下载量便超过一千万次。与此同时,基础设施公司Cloudflare也推出了“AI迷宫”,通过制造海量无意义的虚假网页,将AI爬虫困在假数据的循环中,消耗其算力和时间。可以说,数据投毒在某些领域已经从一种反击手段,演变为版权与利益之争中的防御武器。6ha即热新闻——关注每天科技社会生活新变化gihot.com

去中心化成为AI的防护盾6ha即热新闻——关注每天科技社会生活新变化gihot.com

这种局面让人警觉。创作者的数据“投毒”是为了保护原创,但一旦同样的技术被用于大规模制造虚假信息,其后果可能比版权争议严重得多。6ha即热新闻——关注每天科技社会生活新变化gihot.com

面对这种隐蔽的威胁,研究者正在探索新的防御手段。在美国佛罗里达国际大学的Solid实验室,研究人员正着力用去中心化技术来防御数据投毒攻击。其中一种方法叫联邦学习。与传统的集中式训练不同,联邦学习允许模型在分布式设备或机构本地学习,只汇总参数而非原始数据。这种方式降低了单点中毒的风险,因为某一个设备的“坏数据”不会立刻污染整个模型。6ha即热新闻——关注每天科技社会生活新变化gihot.com

然而,如果在数据汇总环节遭遇攻击,损害依然可能发生。为此,另一种工具——区块链正被引入AI防御体系。区块链的时间戳和不可篡改特性,使得模型更新过程可被追溯。一旦发现异常数据,可追根溯源,定位投毒源头。同时,多个区块链网络还能互相“通报”,当一个系统识别出可疑模式时,可立刻警示其他系统。6ha即热新闻——关注每天科技社会生活新变化gihot.com

任何依赖现实世界数据的AI系统都可能被操纵。利用联邦学习和区块链等防御工具,研究人员和开发者正在打造更具韧性、可追溯的AI系统,在遭遇欺骗时能发出警报,提醒系统管理员及时介入,降低潜在风险。6ha即热新闻——关注每天科技社会生活新变化gihot.com

在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干扰,比如用一束红色激光模拟列车尾灯,那么摄像头可能会误以为轨道上已有列车。久而久之,AI学会了把这种假象当作真实信号,并不断发出“轨道占用”的错误提示。最终,不仅列车调度被打乱,甚至还可能酿成安全事故。6ha即热新闻——关注每天科技社会生活新变化gihot.com

澳大利亚《对话》杂志日前报道称,这是数据“中毒”的一个非常典型的例子。AI系统在学习过程中,如果输入了错误或误导性数据,可能会逐渐形成错误认知,作出偏离预期的判断。与传统的黑客入侵不同,数据“中毒”不会直接破坏系统,而是让AI“自己学坏”。随着AI在交通、医疗、媒体等领域的普及,这一问题正引起越来越多的关注。6ha即热新闻——关注每天科技社会生活新变化gihot.com

AI“中毒”的现实风险6ha即热新闻——关注每天科技社会生活新变化gihot.com

在火车站的例子中,假设一个技术娴熟的攻击者既想扰乱公共交通,又想收集情报,他连续30天用红色激光欺骗摄像头。如果未被发现,这类攻击会逐渐腐蚀系统,为后门植入、数据窃取甚至间谍行为埋下隐患。虽然物理基础设施中的数据投毒较为罕见,但线上系统,尤其是依赖社交媒体和网页内容训练的大语言模型中,它已是重大隐患。6ha即热新闻——关注每天科技社会生活新变化gihot.com

一个著名的数据“投毒”案例发生在2016年,微软推出的聊天机器人Tay上线数小时后,就被恶意用户灌输不当言论,迅速模仿并发布到X(当时的Twitter)平台上,不到24小时就被迫下线并道歉。6ha即热新闻——关注每天科技社会生活新变化gihot.com

据英国《新科学家》杂志报道,2024年,互联网出现了一个标志性事件,即AI爬虫的流量首次超过人类用户,其中OpenAI的ChatGPT-User占据了全球6%的网页访问量,它本质上是ChatGPT的“上网代理”,在用户需要实时信息时替他们访问网站。而Anthropic的ClaudeBot更是长期大规模抓取网页内容,占到13%的流量。6ha即热新闻——关注每天科技社会生活新变化gihot.com

互联网上的大量内容正被AI模型不断采集、吸收,用于持续训练。一旦有人故意投放有毒数据,比如篡改的版权材料、伪造的新闻信息,这些大规模采集的爬虫就可能把它们带进模型,造成版权侵权、虚假信息扩散,甚至在关键领域引发安全风险。6ha即热新闻——关注每天科技社会生活新变化gihot.com

版权之争中的“投毒”反击6ha即热新闻——关注每天科技社会生活新变化gihot.com

随着AI爬虫的大规模抓取,许多创作者担心作品被未经许可使用。为了保护版权,创作者采取了法律和技术手段。如《纽约时报》起诉OpenAI,称其新闻报道被模型学习再利用,侵犯了版权。6ha即热新闻——关注每天科技社会生活新变化gihot.com

面对旷日持久的版权拉锯战,一些创作者转向技术“自卫”。美国芝加哥大学团队研发了两款工具。名为Glaze的工具可在艺术作品中加入微小的像素级干扰,让AI模型误以为一幅水彩画是油画。另一款工具Nightshade更为激进,它能在看似正常的猫的图片中植入隐蔽特征,从而让模型学到“猫=狗”这样的错误对应。通过这种方式,艺术家们让自己的作品在训练数据中成为“毒药”,保护了原创风格不被复制。6ha即热新闻——关注每天科技社会生活新变化gihot.com

这种反击方式一度在创作者群体中风靡。Nightshade发布不到一年,下载量便超过一千万次。与此同时,基础设施公司Cloudflare也推出了“AI迷宫”,通过制造海量无意义的虚假网页,将AI爬虫困在假数据的循环中,消耗其算力和时间。可以说,数据投毒在某些领域已经从一种反击手段,演变为版权与利益之争中的防御武器。6ha即热新闻——关注每天科技社会生活新变化gihot.com

去中心化成为AI的防护盾6ha即热新闻——关注每天科技社会生活新变化gihot.com

这种局面让人警觉。创作者的数据“投毒”是为了保护原创,但一旦同样的技术被用于大规模制造虚假信息,其后果可能比版权争议严重得多。6ha即热新闻——关注每天科技社会生活新变化gihot.com

面对这种隐蔽的威胁,研究者正在探索新的防御手段。在美国佛罗里达国际大学的Solid实验室,研究人员正着力用去中心化技术来防御数据投毒攻击。其中一种方法叫联邦学习。与传统的集中式训练不同,联邦学习允许模型在分布式设备或机构本地学习,只汇总参数而非原始数据。这种方式降低了单点中毒的风险,因为某一个设备的“坏数据”不会立刻污染整个模型。6ha即热新闻——关注每天科技社会生活新变化gihot.com

然而,如果在数据汇总环节遭遇攻击,损害依然可能发生。为此,另一种工具——区块链正被引入AI防御体系。区块链的时间戳和不可篡改特性,使得模型更新过程可被追溯。一旦发现异常数据,可追根溯源,定位投毒源头。同时,多个区块链网络还能互相“通报”,当一个系统识别出可疑模式时,可立刻警示其他系统。6ha即热新闻——关注每天科技社会生活新变化gihot.com

任何依赖现实世界数据的AI系统都可能被操纵。利用联邦学习和区块链等防御工具,研究人员和开发者正在打造更具韧性、可追溯的AI系统,在遭遇欺骗时能发出警报,提醒系统管理员及时介入,降低潜在风险。6ha即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3381-0.html数据“中毒”会让AI“自己学坏”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:记者手记:在“冰丝带”见证机器人“超越自我”

下一篇:我国空间站舱外服B实现“4年20次”延寿目标

为你推荐
  科技日报记者 宗诗涵  持续跳动的“心脏”、有代谢功能的“肝脏”、会呼吸的“肺”……在...
01-21
  原标题:最新!这些高速收费站关闭  雪天最新路况  截至1月26日13时16分,受降雪天气影响,葫芦岛、朝...
01-27
  1月26~27日,辽宁出现1965年以来近60年间1月最强降雪过程。2025年1月26日4时至1月28日8时辽宁省降雪分...
01-29
  红星资本局1月19日消息,近日,新世界发展(00017.HK)总裁黄少媚自掏腰包买入公司豪宅,花费5488万港元,引发关注。  黄少媚上任不足两个月,月薪约为98.5万港元。她接棒新世界...
01-21
  去年12月中旬以来,广东省在内的华南多个沿海城市海边出现大量“球形棕囊藻”,同时引发赤潮。  赤潮是一种海洋生态灾害现象,通常由藻类等海洋浮游生物的大量繁殖引起,...
01-21
1 月 27 日消息,蔚来官方宣布,1 月 27 日,蔚来第 3,100 座换电站于四川省凉山德昌县汽车站正式上线,加速推进换电县县通布局。据蔚来官方称,蔚来用户累计换电超过 6,400 ...
01-28
2 月 6 日消息,据 Thelec 报道,LG 新能源(LG Energy Solution)将为特斯拉新款 Model Y 供应 2170 电池。报道称,新电池的电芯容量为 5300 毫安时,相较于此前的 5000 毫安...
02-06
  1、《掌心》礼宗旭是坏人,他是十恶不赦的大反派,表面上是大善人,私下里做尽龌龊勾当。  2、礼宗旭因童年目睹母亲被家暴的阴影,而养成了扭曲的心理,被他凌虐荼毒的无辜少...
02-15
在某知名品牌的活动现场,林心如面对媒体镜头,坦诚地分享了自己对好友陈妍希离婚一事的看法。林心如透露,她是通过公开报道得知陈妍希与陈晓的婚姻走到了尽头。她感慨地说:“这样...
02-22
21世纪经济报道记者林昀肖 实习生苏洋 北京报道春节假期已临近结束,而假期复工后往往会感觉容易疲倦、难以集中精神、心神不定、失眠、胃口...
02-04
  不少网友在春节期间  开启了天天吃剩菜的生活  这样的“剩宴”安全吗?  哪些食物不适...
02-05
日前,辽宁大学马克思主义学院与沈阳“九·一八”历史博物馆共建活动在辽宁大学崇山校区图书馆学术报告厅...
01-21
一直以来,人类利用完整的微生物细胞作为催化体系来制备所需的产品,例如酿...
01-23
  春节的“脚步”越来越近!近两日,上期所、郑商所、大商所、广期所陆续发布通知,对2025年春节期...
01-24
  近日,恒丰银行股份有限公司(简称“恒丰银行”)因8项违法行为被警告并罚款1060.68万元。《经济...
02-13
金牛座的男生通常被认为是稳重、务实、有责任感的代表。如果你想吸引一个金牛男并让他...
01-22
天蝎座的男生通常被认为是神秘、独立、有魅力的人。他们深思熟虑,善于隐藏自己的情感,并...
01-22
球衣外套怎么穿搭? 夹克外套男装穿搭?一、球衣外套怎么穿搭?1.对于球衣外套来说,搭配运动配套球裤肯定是最适合的,整体服装首先很协调。2.想休闲运动风的话,就可以搭配万能的牛仔...
02-07
与女明星的亲密接触:那些不为人知的幕后故事许多人都梦寐以求能与心目中的女明星亲密接触,然而,背后的故事并不总是光亮丽。今天,我想分享一些我自己与女明星们相遇的经历,以及在...
02-12
京东官宣入局外卖市场。今日下午,京东宣布京东外卖正式启动“品质堂食餐饮商家”招募。京东表示,2025年5月1日前入驻的商家,全年免佣金。对于已签约商户佣金政策是否调整,接近京...
02-12
2月12日消息,情人节前夕,淘宝首次推出礼品卡,同品类可跨店使用。淘宝App显示,目前淘宝礼品卡设有美妆护肤卡、母婴亲子卡,面值共有四档,分别为600、800、1000、2000元。针对即将到...
02-13
2月9日消息,中国动画电影《哪吒2》总票房(含点映及预售)已突破70亿元。四川宜宾、江油等“含吒量”较高的旅游目的地,成为这波流量红利的受益者。同程旅行数据显示,自《哪吒2》电...
02-09
餐饮二手设备回收商还在疯狂回收,而茶饮是重灾区。一位从事二手餐饮设备回收的资深人士告诉虎嗅,2024年奶茶相关设备的回收量成为二...
03-01
岁末年关的春运路上,既有寒风瑟瑟,也有“暖得一匹”的诸多时刻。随着春节临近,2025年春运进入客流高峰,日均发送旅客超过15万人的南京南站,春运客流高峰出现在20日左右。作为六朝...
01-22
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
《博德之门3》开发商拉瑞安工作室的发行总监 MichaelDouse 最近在社交媒体上表示,希望 Steam 能够为想要支持一些独立游戏开发者,愿意花更多钱的玩家提供更多的...
01-28
Game Discover Co发布了2025年1月Steam十大最赚钱的新发售游戏,1月17日发售的《真三国无双:起源》凭借2140万美元收入霸气登顶相当于1.55亿元,《最终幻想7:重生》...
02-04
今天下午,商务部召开例行新闻发布会,新闻发言人在会上表示,今年春节假期,消费市场总体实现平稳开局。后期来看,一季度消费市场总体将继续呈现平稳增长态势。根据商务部商务大数据...
02-06
当地时间2月6日,美国华盛顿州联邦法官约翰·考根诺尔作出裁决,阻止美国总统特朗普此前发布的废除“出生公民权”行政令生效。这是两天内,美国联邦法官第二次对该行政令采取禁令...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮