大模型既要“吃得饱”更要“吃得好”

4个月前 来源:科技日报 观看:45

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。Vsj即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-856-0.html大模型既要“吃得饱”更要“吃得好”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:张成伟代表:把低空安全作为初心使命

下一篇:全国人大代表、万事利集团董事长屠红燕:连续三年呼吁AI应用,加快丝绸纺织业变革

为你推荐
荣耀高层变动终于靴子落地?据媒体报道,1月17日消息,荣耀终端股份有限公司内网发布公告称:“赵明因身体原因,向公司提出辞去CEO等相关职...
01-21
  2月13日,40名辽宁朝阳籍务工人员乘坐G3503次列车抵达大连北站。元宵节过后,随着企业复工复产步伐加快...
02-14
  乍暖还寒时节,在本钢板材冷轧总厂第三冷轧厂车间内,一场“无人化”的生产正在火热进行——无人天车在...
02-15
央视网消息:新年伊始,从空中运输到海上航行,我国各个港口货物来往穿梭,一派繁忙景象。多地增开国际货运航线,立体交通外贸网络织密中国与世界的连接。新年伊始,墨西哥奥胜航空的全...
01-21
  春运第5日铁路客流开始呈现大幅上升趋势  中新网广州1月18日电(郭军 任永霜 李格格)1月18日,2025年春运进入第五日。据广铁集团数据显示,从当日开始,铁路整体客流开始呈...
01-21
[本站 资讯] 近日,小鹏汽车正式推送了AI天玑XOS 5.5.0版本,该版本的新功能,包含图灵AI智驾、智能泊车与出库、AI充电等实用功能。图灵AI智驾车位到车位(先锋版):双击拨杆可...
01-24
1 月 24 日消息,如果你正在犹豫是否选择电动汽车(EV)作为下一辆新车,安全性很可能是一个重要的考虑因素。与传统的燃油车(ICE)相比,电动汽车究竟更安全还是更具风险?澳大利...
01-25
近期,《重症外伤中心》备受关注,播出后引发了广泛讨论。这部剧中的一个关键情节是韩宥林对白江赫医生态度的转变。在剧中,白江赫医生凭借精湛的技术和冷静的态...
02-19
《余烬之上》廖知白被谁杀了?廖知白最后真的死了嘛?在《余烬之上》中,廖知白并非被他人所杀,而是自己策划了死亡。廖知白为了揪出幕后黑手,将自己尸体公之于众,引...
02-21
2月3日,小S(徐熙娣)经纪人向媒体证实,中国台湾知名女演员大S(徐熙媛)在日本旅游期间因患流感并发肺炎不幸离世。据报道,由于大S家人都在日本,因此...
02-04
  新华社北京2月14日电(记者顾天成、侠克)13日,在国家儿童医学中心、北京儿童医院会诊中心,一位专家型AI儿科医生正式“上岗”,与13位儿科专家共同完成了一场疑难病例多...
02-15
    陈清泉受访者供图  ■本报记者韩扬眉  今年6月,第36届世界电动汽车大会时隔3年在美...
01-21
为提升辽宁省中职学校学生干部的能力素质,培养一支具有高度责任感、优秀管理能力和良好道德品质的学生干...
01-21
  新年伊始,锂电行业迎来一波产能扩张热潮,包括宁德时代、亿纬锂能、瑞浦兰钧在内的多家头部电...
01-21
  历经16载漫长筹备后,这家银行的上市之路最终未能成真。不久前,随着广州银行撤回发行上市申请,...
01-24
天蝎座的男生通常都有着神秘而深沉的个性,他们对于感情非常认真,但也很容易受到伤害。如...
01-22
狮子座的男生通常都有着强烈的自尊心和领导欲望,他们喜欢被人尊重和崇拜。因此,如果有人...
01-22
那些在古装剧中美丽动人的女明星们提到古装剧,大家脑海中往往浮现出那些华丽的服饰、动听的音乐和传奇的故事。然而,在这一切的光鲜背后,无疑是那些女明星们令人惊艳的扮相。古...
02-07
泉州潮流服饰必看推荐,让你轻松打造时尚造型当谈到泉州,我的脑海中总会浮现出这座城市独特的文化底蕴,以及那一股浓厚的潮流气息。在这里,不仅仅是历史古迹和美食让人向往,还有那...
02-17
京东官宣入局外卖市场。今日下午,京东宣布京东外卖正式启动“品质堂食餐饮商家”招募。京东表示,2025年5月1日前入驻的商家,全年免佣金。对于已签约商户佣金政策是否调整,接近京...
02-12
2月19日消息,小红书电商日前正式启动运营服务商招募,通过运营服务商的专业化能力和经验,为商家提供账号定位、内容打造、直播操盘、店铺运营、投流推广、货盘供应等服务,加速潜...
02-20
再创新高!据2025年综合运输春运工作专班数据显示,今年春节假期8天(1月28日至2月4日),全社会跨区域人员流动量超23亿人次。全社会跨区域...
02-11
2月24日消息,叮当健康科技集团有限公司公告称,相对于截至2023年12月31日止年度净亏损约2.31亿元,公司预期2024财年净亏损将增加64%以上。图源:东方财富网叮当健康表示,以上亏损主...
02-25
1月21日,赛力斯披露2024年年报业绩预盈公告,公司预计2024年度实现营业收入1442亿元到1467亿元,同比增长302.32%到309.30%;预计2024年实现归属上市公司股东的净利润为55亿元...
01-23
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
RTX 5090和RTX 5080显卡在今天正式开卖,由于货源稀少,性能强劲,一上市很快就被一扫而空,导致很多潜在买家只能“望卡兴叹”。 当然,这些抢显卡的人很多并不是真正...
02-03
任天堂的初代Switch(Nintendo Switch或简称NS)在近日收获了累计销量超过1.5亿台的傲人成绩,不过任天堂方面也承认2024年未能实现NS的销售目标,为此还调低了财年总...
02-06
极目新闻首席记者 戎钰 “打一星的都是‘黑水’!”“我们只想要公平!”“《蛟龙行动》绝不撤档!”这几天,电影《蛟龙行动》的多位主创纷纷表达了对今年春节档竞争中存在的部分不...
02-02
极目新闻记者 张静娴在清晨六七点的随州农贸市场,卖菜卖肉的摊位前早已挤满了人,洋溢着浓厚的春节氛围。在年货市场上,最具代表性的特色年货莫过于炸三鲜了。从过年前几周一直...
02-04
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮