大模型既要“吃得饱”更要“吃得好”

11个月前 来源:科技日报 观看:94

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。mon即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。mon即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。mon即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。mon即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。mon即热新闻——关注每天科技社会生活新变化gihot.com

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。mon即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。mon即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。mon即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。mon即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。mon即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-856-0.html大模型既要“吃得饱”更要“吃得好”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:张成伟代表:把低空安全作为初心使命

下一篇:全国人大代表、万事利集团董事长屠红燕:连续三年呼吁AI应用,加快丝绸纺织业变革

为你推荐
图源:Pixabay 寒武纪(688256.SH)的股价还在震荡,股民心情“过...
01-21
前不久,山东科技大学(以下简称“山东科大”)“海洋测绘工程工学本科专业教学计划”获得国际海道测量师和海图制图师能力标准委员会(IBSC)国际A级认证。...
01-22
  1月14日,2025年除夕火车票正式开售。  2025年春节从1月28日(除夕)开始,至2月4日(正月初七)...
01-21
近日我省这些事业单位发布招聘公告一起来看看1中国医科大学及附属医院  招聘岗位:本次公开招聘3个岗位...
02-18
  春运期间,乘坐高铁动车组列车时,您会看到在座位上方、行李架的下方有一串圆点状指示灯,分为红、绿、黄三种颜色。这些指示灯是干什么用的?不同颜色指示灯代表什么意思?掌...
01-21
  中新经纬1月17日电 “国家邮政局”微信号17日发布的《2024年12月中国快递发展指数报告》(以下简称《报告》)显示,2024年12月,快递发展规模指数为636.2,同比提升28.4%。  ...
01-21
1 月 30 日消息,在今天召开的财报电话会议上,特斯拉公司宣布解锁新里程碑,车辆平均制造成本首次降至 3.5 万美元(当前约 25.4 万元人民币)以下。特斯拉公司还计划在 2025...
01-31
2 月 2 日消息,比亚迪腾势销售事业部总经理赵长江今日发布视频分享了腾势 N9 新车“九大爆料”,其中提到了该车的上市时间、发布节奏,以及部分车型的续航能力。整理赵...
02-02
《180天重启计划》凭借其独特的故事情节、精湛的演员表演以及震撼人心的视听效果,迅速赢得了广大观众的喜爱。播出后不久,该剧就在各大热门视频网站上登上了...
02-19
《星降奇缘》近期备受关注,播出后热度颇高,在各大社交平台上都能看到关于它的新闻和剧情分析。该剧的主演是王初伊和陈圣享,于每天14:00上线,属于女频甜宠题材,...
02-20
  不少网友在春节期间  开启了天天吃剩菜的生活  这样的“剩宴”安全吗?  哪些食物不适...
02-05
21世纪经济报道记者 李佳英 广州报道在国家医保局宣布新一轮医保基金自查自纠工作启动后,地方医保局积极响应。2月5日,广西医保局发布《关于...
02-08
  大众网记者 王一刚 报道  在深化教育改革、全面提升教育质量的背景下,燕山小学教育集团积极响应国家号召,致力于探索并实施具有前瞻性和创新性的教育理念,以培养全面...
01-21
6月16日,我们非常有幸在老师的带领下走进了创聚冰雪,学到了各种各祥的知识。在这次活动中。我还认识到了一个新朋友,活动当天,虽然天空下起了小雨,但是我们都如约赶到活动现场,有...
01-21
  近年来,随着个人消费贷款需求不断增长,不法贷款中介、电信诈骗不法人员盯上了这块“蛋糕”。...
01-24
    2024年,工业硅供应持续增长,多晶硅需求疲弱,在高供应、高库存的情况下,工业硅价格承压下跌...
02-11
摩羯男和金牛女的配对指数非常高,他们在很多方面都能够互补,形成一个稳定而和谐的关系。...
01-22
金牛座的男生通常被认为是稳重、务实、有责任感的代表。如果你想吸引一个金牛男并让他...
01-22
与女明星的亲密接触:那些不为人知的幕后故事许多人都梦寐以求能与心目中的女明星亲密接触,然而,背后的故事并不总是光亮丽。今天,我想分享一些我自己与女明星们相遇的经历,以及在...
02-12
紧身裤模特T台走秀:时尚界的惊艳瞬间每当我走进时尚秀场,看到模特们在T台上自信地步伐,我的心中总是涌起一种莫名的激动。尤其是当紧身裤作为一个重要的时尚单品登上T台时,那种...
02-17
属于雷军的传奇,正在上演。一、小米市值突破万亿,正式进入全球100强企业名单前几年,如果有人跟你说屌丝才用小米,或许有不少人会深有同感。而如果把这句话放到现在来说,很多人只...
02-09
赚钱,无孔不入。1.大小品牌挤进爆火直播间一切生意的本质都是流量,在抖音尤是如此。不知道大家有没有发现,从去年开始,大小品牌开始挤进抖音爆火直播间,通过砸钱给主播送礼物,以此...
02-11
2月9日消息,中国动画电影《哪吒2》总票房(含点映及预售)已突破70亿元。四川宜宾、江油等“含吒量”较高的旅游目的地,成为这波流量红利的受益者。同程旅行数据显示,自《哪吒2》电...
02-09
3月3日,美的发布了DeepSeek智能空调——美的鲜净感空气机T6,宣称“迈入空气思考时代”。据现场体验视频,当厨房TVOC超标时,系统会快速...
03-05
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
2025年,电影《哪吒2》爆火,一个河南85后成了最大赢家。作者 | 老高来源 | 投资家(ID:touzijias)2025年,电影《哪吒2》爆火,一个河南85后成了最大赢家。近日,“全球领先的潮流文化娱...
02-09
在今天的Xbox开发者直面会上,Xbox和光荣出乎所有人的意外公布了《忍者龙剑传2》的决定版,而且方式和之前的小体量游戏《完美音浪》一样采用公布即发售的模式。 ...
01-27
由Sandfall Interactive开发的回合制RPG游戏《光与影:33号远征队》,计划于2025年4月24日正式推出。近日据外媒“Variety”报道,在游戏尚未发售的当下,《光与影:33号...
02-02
来自2025年综合运输春运工作专班数据显示,2025年2月4日(春运第22日,农历正月初七),全社会跨区域人员流动量预计34611万人次。其中,铁路客运量1690万人次,公路人员流动量32556万人次...
02-04
2月8日,哈尔滨亚冬会自由式滑雪女子U型场地技巧决赛,中国选手李方慧、张可欣包揽金银牌!中国选手李方慧凭借第三轮95.25分的成绩夺得金牌,这是中国代表团在哈尔滨亚冬会夺得的首...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮