大模型既要“吃得饱”更要“吃得好”

6个月前 来源:科技日报 观看:64

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。05o即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。05o即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。05o即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。05o即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。05o即热新闻——关注每天科技社会生活新变化gihot.com

前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。05o即热新闻——关注每天科技社会生活新变化gihot.com

这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。05o即热新闻——关注每天科技社会生活新变化gihot.com

数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。05o即热新闻——关注每天科技社会生活新变化gihot.com

提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。05o即热新闻——关注每天科技社会生活新变化gihot.com

如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。05o即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-856-0.html大模型既要“吃得饱”更要“吃得好”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:张成伟代表:把低空安全作为初心使命

下一篇:全国人大代表、万事利集团董事长屠红燕:连续三年呼吁AI应用,加快丝绸纺织业变革

为你推荐
图源:图虫创意 还有10天就是除夕,作为2025蛇年春晚独家电商...
01-21
美国加州大学伯克利分校和韩国高丽大学科学家携手,从变色龙身上获得灵感,研制出一种新型电磁材料。这种材料能够模仿变色龙的变色机制,按需在吸收、传...
01-24
  预计1月26~27日辽宁将有一次强降雪、寒潮、大风天气过程,东部地区有大雪(5~10毫米),局部暴雪(10~18毫米),新...
01-21
  中新网北京1月18日电(记者应妮)蛇年春节在即,记者18日从文化和旅游部非物质文化遗产司获悉,“...
01-21
  红星资本局1月19日消息,近日,新世界发展(00017.HK)总裁黄少媚自掏腰包买入公司豪宅,花费5488万港元,引发关注。  黄少媚上任不足两个月,月薪约为98.5万港元。她接棒新世界...
01-21
  低空经济如何发展?专家呼吁形成“全国一张网”  中新网北京1月21日电(中新财经记者 宋宇晟)2024年被认为是“低空经济元年”。步入2025年,中国低空经济将如何发展?中国低...
01-21
1 月 23 日消息,鸿蒙智行昨日宣布推出“新春出行保障”服务,活动时间为 1 月 22 日(小年)-2 月 5 日(初八),活动对象为鸿蒙智行问界、智界、享界全系车主。整理活动内容如...
01-23
2 月 5 日消息,丰田汽车公司(以下简称“丰田”)与上海市政府今日就共同助力中国社会绿色低碳发展相关举措达成合作意向。丰田决定在上海市金山区成立 LEXUS 雷克萨斯纯...
02-05
  光明日报北京1月19日电(记者牛梦笛、张进进)中央广播电视总台《2025年春节联欢晚会》19日举行...
01-22
最新播出的《重症外伤中心》在各大短视频平台上引起了广泛关注。许多观众对韩宥林掌握的白江赫的秘密感到好奇。在医院的重症外伤中心,韩宥林冷静地坐在会议...
02-19
21世纪经济报道记者武瑛港 北京报道近日,羟基磷灰石的使用问题在医美行业内快速升温。记者获悉,2025年1月21日,深圳市市场监督管理局、深圳市...
01-23
21世纪经济报道记者季媛媛 上海报道 2025年,DeepSeek火爆出圈。借力DeepSeek技术的加持,人工智能(AI)技术正深度重塑医药健康行业格局。当下,...
02-18
2名个人、14项成果获中国科学院杰出科技成就奖 1月16日,中国科学院颁...
01-21
2025年1月辽宁省普通高中学业水平合格性考试报名工作已于2024年11月24日结束。为满足考生需求,结合工作...
01-21
  8起违法违纪案件被通报,累计被罚超5800万,内控合规风险依然突出,营收净利双降的交通银行如何来...
01-24
  中国网财经2月8日讯 日前,国家金融监督管理总局上海监管局核准高建辉中海信托股份有限公司总...
02-11
双子座的男生善于交际,聪明机智,喜欢追求新鲜刺激的事物。他们对于爱情也有着独特的标准...
01-22
天秤座的男生注重外貌和内在的平衡,他们对于美丽有着独特的见解。在他们眼中,漂亮的女生...
01-22
黑白小格子衬衫怎么搭配?一、黑白小格子衬衫怎么搭配?谢题主邀请:夏季黑白小格子衬衣搭配怎么搭配?盛夏美女们简约搭配,都会显得自然大方,帅气可爱又有魅力风度,牛仔裤头配黑白格...
02-07
白衬衫搭配什么裤子男?一、白衬衫搭配什么裤子男?白衬衫搭配1、白衬衫搭配黑色西裤男士白色衬衫搭配一条黑色合身的西裤,系上黑色时尚皮带,穿上英伦皮鞋,很帅气有男人味,适合职场...
02-07
黄铮:用户的需求就是我们的方向标。1、多多国际全面招募海淘商家拼多多对商家下手了。据亿邦动力获悉,近日,拼多多站内的多多国际正全面招募海淘商家入驻,其中针对生活或来往境...
02-18
2月9日消息,京东汽车年货节战报出炉,年货节期间,京东平台上安全预警仪销量同比增长超150%,全景影像产品销量同比增长超100%,应急包商品成交金额同比增长15倍,而能保护孩子安全的安...
02-09
2月26日消息,随着全国各地气温“火箭式”升高,游客们提前启动踏青赏花的脚步,春日旅游市场提前进入旺季。去哪儿平台最新数据显示,2月至3月初,“赏花”相关搜索量同比2024年增长2...
02-27
从学生成长需求出发,用专业研发与科学配比为学生群体提供全方位护航的食用植物油方案——自2024年8月上市以来,中粮福临门学生营养餐专用食用植物调和油在学生油市场中反响热...
01-21
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
遭遇延期的《刺客信条:影》在近日重新开启了预购,由于游戏以日本封建时代为背景,并采用了“黑人武士弥助”的设定以及将其作为主角之一,从而引发了不少争议,尤其是...
01-27
英特尔今天公布了2024年第四季度财报,收入同比下跌,转盈为亏,也延续了上个季度的亏损趋势。同时公布的2024年全年财报未能达到市场的预期,收入和利润双双下跌,同样...
02-03
记者从国铁集团了解到,2月6日,全国铁路发送旅客1514万人次;自1月14日春运启动至2月6日,已累计发送旅客3.1亿人次。今天(2月7日),全国铁路预计发送旅客1410万人次,计划加开列车1469列...
02-07
极目新闻记者 陈倩摄影记者 刘中灿“我们军工人真不容易。他们(指黄旭华和同事们)是搞水下的,比我们更艰难。”2月9日,在吊唁黄旭华的现场,中船集团701所的退休职工许志同深有感...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮