大模型既要“吃得饱”更要“吃得好”

10个月前 来源:科技日报 观看:86

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。eVZ即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-856-0.html大模型既要“吃得饱”更要“吃得好”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:张成伟代表:把低空安全作为初心使命

下一篇:全国人大代表、万事利集团董事长屠红燕:连续三年呼吁AI应用,加快丝绸纺织业变革

为你推荐
半导体行业并购又来了。1月21日,快充芯片龙头南芯科技(688484.SH)发布公告,拟以不超过1.6亿元人民币现金收购珠海昇生微电子有限责任...
01-23
从“神一”到“神十九”,25年间,中国航天带给世界无数次惊喜,人们对航天员在轨期间的工作、生活情况等也越来越关注。未来,随着我国载人航天工程、载人...
01-21
  近日,全省各地陆续发布2024年经济运行数据。面对多重压力叠加、多重挑战并行的复杂形势,在省委、省政...
01-22
1月27日早晨,在沈阳市和平区南一马路,机械设备正在进行除雪作业(央广网记者 李子平 摄)  央广网沈阳1月...
01-29
新闻通讯员 王伟2025年1月20日,“国补”政策首次扩围至消费电子行业。对个人消费者购买华为手机、平板、智能手表手环等3类数码产品(单件销售价格不超过6000元),按产品销售价格...
01-21
  (央视财经《经济半小时》)体验过智能头显的人都会了解一个新概念,虚拟现实技术。身临其境不仅仅是一种视觉体验,还会赋能各行各业,创造出更多的“现实”价值。  在北京,...
01-22
1 月 29 日消息,2025新款比亚迪海豚的实车照今日曝光,展示了不同的前脸设计,采用新造型的大灯,前包围同步进行调整。该车侧面配备隐藏式车门把手,车尾继续采用海洋网家族...
01-30
2 月 1 日消息,特斯拉在海外发布视频,主要展示该公司的自动机械臂整备其 Cybercab无人驾驶出租车。参考视频,相应机械臂能够将车内遗留的物品、喝剩一半的水瓶、未归位...
02-02
  记者 师悦  《哪吒之魔童闹海》热度节节攀升,相关电影周边也卖断了货,可谓一“吒”难求。非...
02-22
在娱乐圈这片星光璀璨的土地上,何炅以其深厚的主持功底和温文尔雅的形象,长久以来赢得了大众的广泛好评。而最近,这位年过半百的主持人又因一个意外的瞬间,成为了众人热议的焦点...
02-22
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家医保局发函回应赴上海调研集采药品质量...
01-21
  回望现代医学的发展,我们不得不承认有一些“疾病”是和时代捆绑在一起的,但也有一些,似乎像是...
02-08
日前,辽宁大学马克思主义学院与沈阳“九·一八”历史博物馆共建活动在辽宁大学崇山校区图书馆学术报告厅...
01-21
新华社北京1月19日电 近日,中共中央、国务院印发了《教育强国建设规划纲要(2024—2035年)》(以下简称《纲...
01-21
  摘要  【氧化铝大涨又大跌后市怎么走?】氧化铝价格大跌后反弹,此前一月内现货报价下跌1400...
01-21
  近年来,随着个人消费贷款需求不断增长,不法贷款中介、电信诈骗不法人员盯上了这块“蛋糕”。...
01-24
狮子座的男生通常自信、热情和有领导力,因此要打动他们的心并不容易。然而,只要你掌握了...
01-22
在星座学中,每个星座都有着不同的性格特点和相处方式。因此,与不同星座的人谈恋爱会带来...
01-22
国内休闲服饰品牌有那些?1 美特斯邦威上海美特斯邦威服饰股份有限公司成立于1995年。公司主要研发、采购和营销自主创立的Meters/bonwe和ME&CITY两大品牌时尚休闲服饰。通过...
02-12
女生格子衬衫搭配什么裤子?一、女生格子衬衫搭配什么裤子?女生穿格子衬衫的时候,建议搭配纯色的裤子。比如说白色、乳白色、浅灰色和黑色以及藏青色的裤子。并且适合穿休闲直筒...
02-17
2月13日消息,商务部新闻发言人何咏前今日介绍“2025全国网上年货节”有关情况。2月5日,2025年全国网上年货节圆满收官。据商务大数据对重点电商平台监测,活动期间,全国日均网上...
02-14
2月18日消息,中经汇达实业有限公司(以下简称:中经汇达)董事长邱云飞一行近日到访涂多多。国联股份高级副总裁、涂多多CEO刘斋,涂多多高级副总裁、跨境产发部总经理邵春生代表公司...
02-18
2月10日消息,快手发布《2025新春团购节老铁消费报告》。数据显示,1月26日至2月4日活动期间,快手本地生活GMV同比增长超117%。“返乡过年”带火了新线城市(三线及以下城市)消费,过...
02-11
3月3日消息,由广州市科学技术局、广州市科技进步基金会指导,广州产业发展研究院联合广州科技金融集团主办的2025广州促进人工智能产业高质量发展交流会近日举行,并发布“2024广...
03-04
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
根据一份流传到网上的内部公告,1月24日,完美世界开除了百万工作室四人,其违规行为包括在素材制作外包管理方面玩忽职守,构成严重失职;利用公司资源、谋取利益,涉及金额巨大;内外相...
02-09
近日,万代南梦宫为《深渊传说》注册了新商标,申请日期2025年为1月16日,公开日期为2025年1月24日。此前,在《传说》系列30周年纪念期间,万代南梦宫曾表示过除了《圣...
01-28
根据 Culture Crave 报道,流媒体平台迪士尼+上出现了最近热门的团队英雄动作射击游戏《漫威争锋》的独立分区。 该分区以“出现在《漫威争锋》的角色为特色”,...
02-11
极目新闻记者 肖名远2月3日(正月初六),贵州省清镇市,余华英拐卖案受害者王能能终于回到老家与亲人们团聚,全村放鞭炮迎接。这一天,王能能的母亲张荣仙等待了30年,但对她来说,这次团...
02-04
今天下午,商务部召开例行新闻发布会,新闻发言人在会上表示,今年春节假期,消费市场总体实现平稳开局。后期来看,一季度消费市场总体将继续呈现平稳增长态势。根据商务部商务大数据...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮