大模型既要“吃得饱”更要“吃得好”

1年前 来源:科技日报 观看:104

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。alV即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。alV即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。alV即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。alV即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。alV即热新闻——关注每天科技社会生活新变化gihot.com

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。alV即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。alV即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。alV即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。alV即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。alV即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-856-0.html大模型既要“吃得饱”更要“吃得好”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:张成伟代表:把低空安全作为初心使命

下一篇:全国人大代表、万事利集团董事长屠红燕:连续三年呼吁AI应用,加快丝绸纺织业变革

为你推荐
1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型...
01-21
飞行中的无人机、正在移动的智能机器人,都可以远程隔空充电,科幻小说里描述的场景有望成为现实。近日,由西安电子科技大学教授李龙课题组与中国科学院...
01-27
  “今年是我在双台镇过冬的第6年,准备住到5月份再回去。”1月16日一大早,59岁的张贺强就前往辽...
01-21
近日我省这些事业单位发布招聘公告一起来看看1中国医科大学及附属医院  招聘岗位:本次公开招聘3个岗位...
02-18
新闻通讯员 木子春运承载着亿万游子对家乡的眷恋与期盼,春节的脚步近了,归心似箭的人们纷纷踏上返乡之路。据交通运输等部门预计,今年春运全社会跨区域人员流动量将达到90亿人...
01-22
  春节广州边检总站口岸出入境客流预计逾41万人次  中新社广州1月18日电(记者 方伟彬)广州出入境边防检查总站(以下简称“广州边检总站”)18日发布消息称,春节假期该总站...
01-21
1 月 26 日消息,吉利汽车集团甲醇汽车业务中心总经理陆玉凯透露,吉利今年推出两款醇电混动车型,即吉利全新一代“醇氢电混”轿车和 SUV 车型,相关车型顾名思义,就是能够...
01-27
2 月 1 日消息,寒冷天气会导致电动汽车续航里程下降,温度越低,单次充电能行驶的距离就越短。温度来到冰点以下之后,电动车的续航损失究竟有多大?据外媒 Carscoops 今日报...
02-02
《漫城》正在热播,凭借其精彩的剧情、精良的制作和演员们的出色表现,该剧赢得了观众的一致好评,并取得了收视率第一的成绩。在剧中,白筱朵一直犹豫是否应该向苏...
02-20
随着电视剧的热播,“夜魔侠重生上映时间是什么时候”这一话题逐渐吸引了众多粉丝的目光。该剧播出后,凭借其精彩的剧情、精良的制作和演员们的精湛表演,赢得了...
02-21
  降糖药物的选择应根据糖尿病患者的自身病情、经济条件,潜在性副作用等因素综合考虑。通过这篇文章,希望帮助更多糖尿病患者达到...
01-21
  图①:1月1日凌晨,吉林大学白求恩第一医院妇产中心产科,助产士在为新生儿印脚印。  新华社记者 张 楠摄  图②:贵州黔西市文峰街道文峰社区珠海蓝逸贝贝托育园,孩...
01-21
作者:郑莉(首都师范大学音乐学院音乐教育系主任、教授)美育课程在高校通识教育中的重要作用毋庸置疑。要提...
01-22
近日,共青团中央、教育部联合印发《关于共建高校“大思政”体系 推动高校共青团工作高质量发展的实施意...
01-22
  又一地方中小银行结束IPO“长跑”。1月17日,深交所发布公告,因广州银行及其保荐人撤回发行上...
01-22
  2月5日晚间,宁波银行正式发布2024年度业绩快报,公司2024全年实现营业收入666.32亿元,较上年同...
02-06
摩羯座的男性通常被认为是稳重、踏实、有责任感的代表。他们注重事业和目标,对自己和周...
01-22
水瓶座男生以其独特的个性和思维方式而闻名。他们聪明、创新、理性,善于思考和分析问题...
01-22
莆田珠宝产业:从传统手工到现代设计的华丽蜕变提到珠宝,许多人可能会想到璀璨夺目的钻石和繁复精致的手工艺品。然而,若我告诉你,在中国的莆田,这座城市正以其卓越的珠宝产业悄然...
02-07
掀起潮流风暴:深入探讨潮流文化与服饰的融合潮流文化是一种与时尚密切相关的现象,它不仅影响着人们的穿着打扮,还渗透到生活的各个角落。在这个快速变化的时代,每一季的新趋势都...
02-12
2月13日消息,徐州多多万品电子商务有限公司董事长李婷、总裁韩秀丽一行近日到访国联股份冷链多多,冷链多多CEO梁豪、多多万店事业部总经理张敏代表公司接待了来访嘉宾,双方围绕...
02-14
2月15日消息,2025海淀区经济社会高质量发展大会日前举行,小米集团创始人、董事长兼CEO雷军发表了主题演讲,回顾了小米过去15年的创业历程,并分享了企业在面对挑战时的经验与未来...
02-16
新春将至,年末大扫除又来了。作为确保家居环境清洁与安全的清洁剂,哪些品牌曾被监管部门抽检出不合格?大家对家居清洁剂的了解有多少...
02-07
2月27日消息,京东外卖宣布推出“10元/20元餐补随机领”优惠活动,用户每晚8点即可随机领取“满15元减10元”“满40元减20元”两种大额餐补优惠券,首批覆盖通过京东认证的大学生...
03-01
近日,珠海市合心财税科技有限公司(简称“财税科技”)迎来了重要的发展里程碑。公司宣布,已完成5000万元人民币的融资,由中经金控投资有限公司(以下简称...
02-07
2024年12月2日、深圳市盛联投资控股有限公司(以下简称“盛联投资”)完成对江苏超级欧克人工智能科技有限公司(以下简称“欧克科技”)进行战略性投资,融...
02-07
快科技今日(1月23日)消息,前几天中国台湾嘉义大埔地区发生里氏6.4级浅层地震,此次地震对台南科学园区的部分半导体工厂造成了影响。 据媒体报道,台积电位于台南的...
01-24
由AlterEyes打造的像素风3D休闲涂色游戏《彩色立方体(Color-A-Cube)》,现已在Steam平台推出试玩Demo。 本作中玩家将有着身临其境的着色体验,让您可以探索体素世...
02-05
“海上神器展锋芒,油气开发创辉煌”。今天说的神器就是中国制造的亚洲首艘圆筒型浮式生产储卸油装置(FPSO)——“海葵一号”。《渔舟唱晚》在民族音乐里可谓是鼎鼎有名。音乐一...
02-03
极目新闻通讯员 凌丽万“巳”大“集”闹新春,非遗技艺过大年。2月3日,正月初六,又恰逢二十四节气之首“立春”,为庆祝首个“非遗版”春节,弘扬中华优秀传统文化,寄托岁首美好期盼,...
02-04
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮