大模型既要“吃得饱”更要“吃得好”

1年前 来源:科技日报 观看:124

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。41z即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。41z即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。41z即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。41z即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。41z即热新闻——关注每天科技社会生活新变化gihot.com

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。41z即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。41z即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。41z即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。41z即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。41z即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-856-0.html大模型既要“吃得饱”更要“吃得好”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:张成伟代表:把低空安全作为初心使命

下一篇:全国人大代表、万事利集团董事长屠红燕:连续三年呼吁AI应用,加快丝绸纺织业变革

为你推荐
AI智能体,或将成为2025年的关键词之一,国内外厂商激战正酣,探索其能为千行百业带来的变化。但对数据安全的忧虑也浮出水面。有多少交互的工作内容会上...
01-21
【新春走基层·我在大国工程现场】开栏的话 冬去春来,四季更替,又到了喜迎新春的时刻。浓浓的年味里,有人分秒必争,以奋斗书写新一年的梦想;有人...
01-24
  据气象部门监测,预计1月26日至27日我省将有一次强降雪、寒潮、大风天气过程,东部地区有大雪(5~10毫米...
01-23
辽宁省汽车快速客运站发布停班通知  因高速口封闭,今日我站除桃仙机场外所有线路暂时停运,给您带来不便...
01-31
  中新经纬1月21日电 国新办21日举行“中国经济高质量发展成效”系列新闻发布会,介绍“大力推进新型工业化 推动经济高质量发展”有关情况。工业和信息化部副部长张云明在...
01-21
  中新经纬1月20日电 国新办20日举行“中国经济高质量发展成效”系列新闻发布会,介绍“夯实‘三农’基本盘,扎实推进乡村全面振兴”有关情况。农业农村部副部长张兴旺在会上...
01-21
1 月 21 日消息,奇瑞捷途纵横今日连续发布旗下首款车型预告视频,全新序列将于明日(1 月 22 日)19:00 举行新品发布会。从官方视频可以看到,这款新车采用了硬派 SUV 设计,...
01-21
[本站 资讯] 本期本站的《2025新车大爆料》将为大家带来长安集团的2024年销量回顾以及2025年新产品规划。2024年长安集团旗下众多品牌齐心创造了近七年销量新高,并且...
01-21
《难哄》段嘉许谁饰演?段嘉许和桑稚相隔多少岁?在电视剧《难哄》中,段嘉许由吴宇恒饰演。段嘉许和桑稚相隔多少岁原著:段嘉许出生于1989年,桑稚出生于1997年,两人...
02-19
最近,“难哄的刘楚恬有吻戏吗”引起了广泛关注。这部作品自宣传以来就备受期待,播出后也确实赢得了观众的喜爱。今天就来聊聊这个话题,希望能解答大家的好奇心...
02-20
21世纪经济报道记者 闫硕 北京报道1月16日,《柳叶刀-糖尿病与内分泌学》重大报告“临床肥胖症定义和诊断标准”在全球发布。报告明确了“临...
01-21
21世纪经济报道记者林昀肖 实习生苏洋 北京报道近日,天力士公告表示,其收到华润三九发来的通知,华润三九已于近日收到中国华润有限公司转发的...
02-11
为提升辽宁省中职学校学生干部的能力素质,培养一支具有高度责任感、优秀管理能力和良好道德品质的学生干...
01-21
2025年辽宁省普通高等学校艺术类专业招生简章  一、艺术类考生高考报名  艺术类考生高考报名工作按...
01-21
  摘要  【每日龙虎榜】周一商品期货综合指数下跌0.43%,日内资金净流出76.44亿元。一文带你...
01-21
  1月21日,在岸人民币对美元汇率延续反弹势头,于日间交易时段最高上涨超过500个基点。专家表示,...
01-22
星座一直以来都是人们关注的话题,尤其是在恋爱和婚姻方面。每个星座都有自己独特的性格...
01-22
水瓶座的男生是一个非常独立和自由的人,他们对于爱情有着独特的看法和追求。他们喜欢与...
01-22
一米七腿粗男生怎么穿搭?一、一米七腿粗男生怎么穿搭?男的一米七个子是比较矮的,这样的人身材墩实,腿又粗又短,搭配衣服是一件难的事情,我建议应该搭配一些颜色比较浅的衣服,最好是...
02-12
如何通过色彩搭配提升模特T台走秀的视觉效果在时尚界,**色彩搭配**的重要性不言而喻,尤其是在模特的T台走秀中。每一场走秀都是设计师创意的体现,但背后的色彩选择和搭配更是决...
02-12
2月11日消息,天眼查App显示,近日,合肥三只羊网络科技有限公司、广州市美诚食品有限公司等新增一则开庭公告,原告为许某,案由为信息网络买卖合同纠纷,该案将于4月2日在福建南平市建...
02-12
阿里苹果或将联手,为iPhone开发AI功能一则重磅消息,让阿里股价再创阶段新高。2月11日晚间,据The Information援引知情人士消息称,苹果为了应对在中国市场销售下滑的局势,正积极寻...
02-13
2月21日消息,天猫养车日前与山西诺维兰集团正式签订战略合作,首批5家门店已完成签约,后续双方将在山西全省布局50+透明养车网络。双方将从空间重构、品牌共生、数字基建、流量...
02-22
1.京东外卖上线大额补贴这次京东入局外卖市场,真是拿出了破釜沉舟的拼劲。这不,继全额承担外卖骑手五险一金所有成本后,京东又给外卖消费者送上了大额补贴福利。2月27日,京东外...
03-01
近来,交易领域的流行语不外乎是“技术”和“创新”。 虽然许多业内人士都在强调尖端解决方案,但本质上真正的进步是远非这些营销炒作所能比的。 名副其实的创新是能为交易者提...
01-21
2024年,年轻人的生活方式和消费行为发生了显著变化,需求的多元化和精细化,直接影响着品牌的营销策略和创新方向。从注重“质价比”的理性消费到对情绪价值的追求,从圈层文化的细...
01-23
1月24日今天,PS商店公布2024游戏下载排行,《FF7:重生》登顶PS5平台(日区)。《怪物猎人:世界》则成为了PS4平台日本玩家最喜爱的游戏。 ·本次的官方统计包含PS5、P...
01-25
今日(2月4日),恐怖片《死神来了6》首曝预告,《死神来了》已推出25周年,聚焦死神对少男少女们下手,上演各种恐怖的死法,前五部于2000年-2011年上映。 宣传片: 本片由...
02-04
央视网消息:据网络平台实时数据,截至2月2日13时23分,2025年度电影总票房(含预售)突破85亿元。...
02-02
你的浏览器不支持video标签。极目新闻记者 张屏 视频剪辑 李仪2月5日,10位“楚才”人形机器人在武汉洪山礼堂组团亮相,为湖北省“新春第一会”上演科技序曲。其中,华中科技大学...
02-05
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮