大模型既要“吃得饱”更要“吃得好”

7个月前 来源:科技日报 观看:70

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。a9I即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。a9I即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。a9I即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。a9I即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。a9I即热新闻——关注每天科技社会生活新变化gihot.com

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。a9I即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。a9I即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。a9I即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。a9I即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。a9I即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-856-0.html大模型既要“吃得饱”更要“吃得好”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:张成伟代表:把低空安全作为初心使命

下一篇:全国人大代表、万事利集团董事长屠红燕:连续三年呼吁AI应用,加快丝绸纺织业变革

为你推荐
1月17日,国家统计局发布2024年中国经济年报:初步核算,2024年国内生产总值比上年增长5.0%;全国城镇调查失业率平均值为5.1%,比上年下降0.1个百分点;居民人...
01-21
2025年国际消费电子展(以下简称“CES 2025”)于1月7日至10日在美国拉斯维加斯举行。此次展会上,来自全球160多个国家和地区的4500多家企业和团体齐聚...
01-24
  1月26日至27日,我省多地降雪,局部大到暴雪并伴有寒潮和大风天气,全省大部分地区道路积雪、结冰,给春运...
01-28
  受益于亚冬会带来的冰雪经济新热度,滑雪服、羽绒服、滑雪手套等装备的销量在这个冬天迎来了一波新增...
02-15
会议现场 红网时刻新闻1月21日讯(记者陈奥男 刘志雄)今天,2025年全省商务工作会议暨扩消费工作推进会在长沙召开。记者从会上获悉,2025年湖南力争社会消费品零售总额增长5.5%...
01-22
  中新经纬1月17日电 题:外贸“三量”齐升下有哪些商机?  作者 张建平 商务部国际贸易经济合作研究院学术委员会副主任  2024年,我国外贸实现了总量、增量、质量的“三量...
01-21
1月10日,焕新Model Y正式登陆特斯拉中国官网,同时上线首发版车型,预售价26.35万元起,在外观、座舱、续航等方面均迎来升级,安全、智能等硬核产品实力进一步提升,使这款全球最畅销...
01-21
蛇舞新春,科技贺岁!万众期待的2025年央视蛇年春晚如期而至。在今年的春晚舞台上,780台问界M9带来划破夜空、直穿云霄的震撼灯光表演,问界M9化身为灵动的“光影舞者”,以闪耀变幻...
01-31
最近播出的电视剧《夫人为何如此无情》受到了很多人的喜爱,热度持续上升。这部剧不仅因为其扣人心弦的情节吸引观众,还因其丰富的剧情讨论点成为了大众关注的...
02-20
《难哄》段嘉许喜欢谁?段嘉许和桑稚在一起了吗?‌段嘉许在《难哄》中喜欢的是桑稚‌。段嘉许和桑稚的哥哥桑延是朋友,最初段嘉许将桑稚视为妹妹,对她只有兄长般...
02-22
编者按:一个人工智能(AI)机器人,在短短8天内独立完成了668项实验,合成了668种化合物,并成功研发出一种全新的化学催化剂。这一壮举令人赞叹。AI...
02-11
21世纪经济报道记者武瑛港 北京报道近日眼科医疗器械上市公司爱博医疗发布业绩快报,2024年该企业实现营收14.10亿元,同比增长48.22%,实现扣非...
02-12
  大众网记者 杨涛报道  近日,2024年山东省“技能兴鲁”职业技能大赛暨第五届山东省汽车服务行业职业技能竞赛在青岛港湾职业技术学院成功举行。“技能兴鲁”职业技能...
01-21
记者11月13日从教育部获悉,教育部办公厅近日发出通知,部署加强市域产教联合体建设。通知提出将市域产教联...
01-21
  摘要  【供需有望改善钢价或先抑后扬】1月上旬,炉料补库渐入尾声,下游需求处于淡季,炉料及钢...
02-05
  近期,保险资金频繁“扫货”上市公司股票。根据Wind统计,今年以来,包括平安人寿举牌邮储银行H股...
02-11
水瓶座男生通常被认为是理性、独立和冷静的人。他们不容易表达自己的情感,因此要判断一...
01-22
水瓶座的男生一向以聪明、理性和独立著称。他们善于思考,注重自由和个人空间。然而,当涉...
01-22
男商务衬衫搭配什么裤子好看?一、男商务衬衫搭配什么裤子好看?搭配一:牛仔裤牛仔裤应该是男士日常穿搭中的必备裤装,时尚、个性又百搭,搭配一件格子衬衫或者任何休闲风格的衬衫都...
02-07
女款小立领衬衫怎样搭配外套?立领西服与立领服饰搭配技巧1、 不同场合下正式场合:成熟儒雅――进退有度的气节推荐搭配:深色立领西服套装(立领白衬衫+深色立领西装)黑色为主的...
02-17
1月24日消息,国联股份冷链多多数字云仓(寮步仓)开仓仪式近日在东莞市寮步镇举办,标志着冷链多多禽蛋产业链仓网布局在华南地区再落一子。涂多多高级副总裁、物流部总监安珅,冷链...
02-07
2月20日消息,永辉超市2025年首期全国调改店长专项培训近日落幕。来自全国各地的167名店长学员顺利结业,这一成果标志着永辉超市“2025调改计划”人才培养体系落地,为全国门店调...
02-21
2月27日消息,《饿了么2024社会责任报告》今日正式发布。报告显示,在AI技术的助力下,饿了么“互联网 +明厨亮灶”识别能力已覆盖超过20万家商户,累计预警2,000余次食品安全隐患;20...
03-01
3月2日消息,天猫健康滋补保健中药行业发展规划暨招商大会近日召开。天猫健康在会上发布保健行业加码新商培育、经营激励专项措施,2025年将投入5亿元惠商资金,扶持商家经营,实现...
03-03
2025年1月21日中金公司发布了“全球Robotaxi第一股”文远知行的调研报告,这一报告引起了媒体的广泛关注。中金公司在财报中指出文远知行有着三大显著特点:1、自动驾驶行业的先...
01-23
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
谷歌于上个月与三星和高通合作,推出了安卓扩展显示(AndroidXR)平台。 公司称它是“为下一代计算构建的新操作系统”,并且目前收购了 HTC Vive 的部分工程团队,他们...
01-25
角色扮演游戏如今没有20世纪90年代时那么复杂,这已不是什么秘密。多年来,许多游戏机制和特色都被简化,以便让更广泛的玩家群体能够轻松上手,但这也让一些经典RPG的...
02-02
极目新闻记者 付瞰是谁,在大年初五见到了肖战?哦,是我们武汉影迷啊。2月2日大年初五中午,电影《射雕英雄传:侠之大者》在武汉百丽宫影城举办惊喜见面会,数百位武汉影迷受邀与影片...
02-02
澎湃新闻记者 邹佳雯“回到2019年,总是在书本和新闻中出现的老人,就坐在我们面前,那是一位可爱的寻常老人,说话带笑意,脸色红润润的,身体随着讲述有小幅的晃动,故事讲得很有感染力,...
02-10
SQL Error: select * from ***_ecms_news1 where id in(251,38,165,,138,275,171,24) limit 8
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮