用AI生成数据训练AI或导致模型崩溃,原始内容9次迭代后成了“胡言乱语”

3个月前 来源:中国科技网 观看:17

《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练AI模型的重要性。DoY即热新闻——关注每天科技社会生活新变化gihot.com

生成式AI工具越来越受欢迎,如大语言模型等,这类工具主要用人类生成的输入进行训练。不过,随着这些AI模型在互联网不断壮大,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。DoY即热新闻——关注每天科技社会生活新变化gihot.com

包括英国牛津大学在内的联合团队一直在进行相关研究,并在去年论文预印本中提出这一概念。在正式发表的论文中,他们用数学模型演示了AI可能会出现的“模型崩溃”。他们证明了一个AI会忽略训练数据中的某些输出(如不太常见的文本),导致其只用一部分数据集来自我训练。DoY即热新闻——关注每天科技社会生活新变化gihot.com

团队分析了AI模型会如何处理主要由AI生成的数据集。他们发现,给模型输入AI生成的数据,会减弱今后几代模型的学习能力,最终导致了“模型崩溃”。他们测试的几乎所有递归训练语言模型,都容易出现问题。比如,一个用中世纪建筑文本作为原始输入的测试,到第9代的输出已经是一串野兔的名字。DoY即热新闻——关注每天科技社会生活新变化gihot.com

团队指出,用前几代生成的数据集去训练AI,崩溃是一个不可避免的结局。他们认为,必须对数据进行严格过滤。与此同时,这也意味着依赖人类生成内容的AI模型,或许能训练出更高效的AI模型。DoY即热新闻——关注每天科技社会生活新变化gihot.com

总编辑圈点:DoY即热新闻——关注每天科技社会生活新变化gihot.com

对AI来说,“模型崩溃”就像癌症一样,甚至分早期与晚期。在早期时,被“喂”了生成数据的AI会开始失去一些原始正确数据;但在晚期,被“喂”了生成数据的AI会“口吐狂言”——给出完全不符合现实,也和底层数据一点不相关的结果,就像本文中的例子一样。更可怕的是,“模型崩溃”的AI极其固执,错误几乎难以矫正。它会持续强化,最终把错误结果认为是正确的。这一问题值得所有关注生成式AI的人们警惕,因为它等于是在“毒化”AI对真实世界的认知。DoY即热新闻——关注每天科技社会生活新变化gihot.com

《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练AI模型的重要性。DoY即热新闻——关注每天科技社会生活新变化gihot.com

生成式AI工具越来越受欢迎,如大语言模型等,这类工具主要用人类生成的输入进行训练。不过,随着这些AI模型在互联网不断壮大,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。DoY即热新闻——关注每天科技社会生活新变化gihot.com

包括英国牛津大学在内的联合团队一直在进行相关研究,并在去年论文预印本中提出这一概念。在正式发表的论文中,他们用数学模型演示了AI可能会出现的“模型崩溃”。他们证明了一个AI会忽略训练数据中的某些输出(如不太常见的文本),导致其只用一部分数据集来自我训练。DoY即热新闻——关注每天科技社会生活新变化gihot.com

团队分析了AI模型会如何处理主要由AI生成的数据集。他们发现,给模型输入AI生成的数据,会减弱今后几代模型的学习能力,最终导致了“模型崩溃”。他们测试的几乎所有递归训练语言模型,都容易出现问题。比如,一个用中世纪建筑文本作为原始输入的测试,到第9代的输出已经是一串野兔的名字。DoY即热新闻——关注每天科技社会生活新变化gihot.com

团队指出,用前几代生成的数据集去训练AI,崩溃是一个不可避免的结局。他们认为,必须对数据进行严格过滤。与此同时,这也意味着依赖人类生成内容的AI模型,或许能训练出更高效的AI模型。DoY即热新闻——关注每天科技社会生活新变化gihot.com

总编辑圈点:DoY即热新闻——关注每天科技社会生活新变化gihot.com

对AI来说,“模型崩溃”就像癌症一样,甚至分早期与晚期。在早期时,被“喂”了生成数据的AI会开始失去一些原始正确数据;但在晚期,被“喂”了生成数据的AI会“口吐狂言”——给出完全不符合现实,也和底层数据一点不相关的结果,就像本文中的例子一样。更可怕的是,“模型崩溃”的AI极其固执,错误几乎难以矫正。它会持续强化,最终把错误结果认为是正确的。这一问题值得所有关注生成式AI的人们警惕,因为它等于是在“毒化”AI对真实世界的认知。DoY即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-10433-0.html用AI生成数据训练AI或导致模型崩溃,原始内容9次迭代后成了“胡言乱语”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:多个旅游热门城市宣布,除部分重点景区外,均无需预约——取消景区预约,游客体验如何

下一篇:国家地震预警工程竣工 总体功能与性能达到世界先进水平

为你推荐
取现请认准靠谱提客服【v信:1312339978、15873152131】大部分人都会陷入自己的财务状况处于紧张状态。而部分人为了缓解财务紧张,又不想请身边朋友或者同事帮忙,所以将目光转移...
08-17
分付套现秒回,快速秒回的方法已揭晓随着社会的快速发展和人们生活品质的不断提升,我们的消费水平也在逐步提高。然而,偶尔我们可能会遇到一些经济上的小困难,手头稍显紧张。在...
08-08
见利不亏其义,见死不更其守。——《礼记·儒行》  译:不要见到财利就做有损于大义的事,宁可牺牲自己的生命,也决不改变自己的志节。 京东金融旗下有一款名...
08-07
广州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-05
  海报新闻记者 孙佃潇 北京报道  今日(10月14日),京津冀等8省市部分地区有大雾天气,局地有不足200米的强浓雾。10月14日上午,北京有大雾天气,能见度较差  中央气象台10...
10-28
  中新社上海9月6日电 题:加强与中国经贸合作为何是非洲正确选择?  ――专访上海财经大学国际教育学院专业课外教、非洲商会首席数据分析师艾米乐  作者 高志苗  2024...
09-12
[本站 资讯] 2024北京车展已经拉开了帷幕,本届车展有200余款新车发布/上市,不乏诸多重磅车型。为了方便各位了解新车信息,我们制作了车展新车汇总系列选题,按照展馆的维...
04-26
横评:微信分付为什么只能扫10块-秒到6种绝对技巧继蚂蚁花呗、京东白条之后,“分付”代表腾讯系重新点燃了信用支付的战火。将来用户在使用微信支付时,或许可以使用“分付”先...
09-09
谈吐:分付刷什么二维码能刷得出来(14种方法详细的操作步骤)可如果当前可用额度低于交易金额,比如交易金额是500元,可分付可用额度只有300元,使用分付扫码付款会因为额度不足无...
09-05
春分是春季的一个重要节气,在这时候我们要注意,由于春分的时候温差是非常大的,所以我们在这时候就容易出现身体免疫力下降的不适情况,这对我们健康的影响也是不小的,很容易就会因...
04-02
  大众网记者 秦瑾 报道  8月31日,齐鲁工业大学(山东省科学院)的校园内热闹非凡,8000余名本科新生如约而至,为这座学府注入了新的活力。迎新现场秩序井然,新生们怀着对未来...
09-02
8年专业老商家微:KXA665【8年专注更专业】【靠谱秒到】24小时在线接单分付24小时回收商家(小白看完也能自己轻松取现)最近,许多商家都开始使用分付24小时回收服务了。这种服务...
08-21
长春风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-11
绍兴风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-26
上海风控花呗白条套取秒到账:【181 181 43671微信同号】万事达 、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已...
08-22
  中国日报网7月24日电 据美国有线电视新闻网(CNN)公布的一项最新民意调查显示,39%的美国成年人表示,担...
07-25
  不久前,美国政府宣布维持全部“301”关税,并对中国锂电池、光伏电池、电动汽车、关键矿产、半导体等...
07-24
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮