生成式AI“幻觉”困境如何破解

1年前来源：中国科技网观看：177

人工智能（AI）技术正以前所未有的速度发展，生成式AI凭借其惊人的创造力，不断刷新人们的认知。然而，即便是看似“聪明绝顶”的AI，也难逃“幻觉”的困扰。这里的“幻觉”，指的是AI生成看似合理但实际不准确或虚假的信息。

英国《自然》杂志网站在1月22日的报道中指出，AI“幻觉”可能会引发严重后果，科学家正各出奇招，力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等，以促进AI的健康、高效发展。

主因是数据模糊

各种生成式AI，包括由大语言模型驱动的聊天机器人，常常会编造信息。它们有时会模糊事实与虚构，在看似真实的陈述中夹杂错误信息。这既是其创造力的体现，也是其不足之处。

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称，大语言模型的设计原理并非输出准确事实，而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”，人们难以洞悉其推理过程。

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示，在训练过程中，这些模型会压缩数万亿个单词间的关系，随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容，但剩下2%的内容却会让其“误入歧途”，生成不准确或虚假信息。

导致AI出现“幻觉”的原因多种多样，其中训练数据中的模糊性和错误是常见因素。也有人认为，即使训练数据准确无误，AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此，即使经过人类反馈调整过的聊天机器人，也无法完全避免出错。

多领域面临考验

AI的“幻觉”可能会给人们的工作和生活带来较大影响。

在新闻领域，大语言模型可能生成虚假新闻事件，扰乱信息传播秩序，误导公众认知。Vectara公司针对文档内容开展的研究表明，一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示，错误和虚假信息是2025年全球面临的五大风险之一。

在法律领域，它可能引用虚构的法律条文和案例。比如，2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT，在法庭文件中引用了并不存在的法律案例。而在医学领域，它可能提供错误的诊断和治疗建议，危及患者生命。

《自然》在报道中指出，AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现，各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签，提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑，可能会引发一系列问题。

多举措减少“幻觉”

为进一步提升AI的精确度，科学家正想方设法降低其“幻觉”。

例如，增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本，并可能削弱聊天机器人的其他能力，如机器学习算法对未知数据的预测和处理能力。

此外，使用更大、更干净的数据集进行训练，也是降低AI模型“幻觉”出现的有效途径。然而，当前可用数据的有限性限制了这一方法的应用。

检索增强生成（RAG）技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本，从而确保回复内容的真实性，以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域，RAG技术备受青睐。

不过，美国斯坦福大学计算机科学家米拉柯·苏兹根表示，尽管RAG能提升内容真实性，但其能力有限。苏兹根团队的研究表明，一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进，但仍存在不足。

开发者也可以使用一个与AI训练方式不同的独立系统，通过网络搜索对聊天机器人的回复进行事实核查，谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能：内容如果突出显示为绿色，表示其已通过网络搜索验证；内容如果突出显示为棕色，则表示其为有争议或不确定的内容。但是，这种方法计算成本高昂且耗时，而且系统仍会产生“幻觉”，因为互联网上错误信息泛滥。

在去年6月出版的《自然》杂志上，英国牛津大学科学家刊发论文称，他们利用“语义熵”，通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种，被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性，来计算模型的困惑程度，从而为用户或模型提供警示，提醒其采取必要的循证措施，确保更准确的答案输出。

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时，绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式，可以告诉我们AI模型是在“说真话”，还是在“胡说八道”。

主因是数据模糊

多领域面临考验

AI的“幻觉”可能会给人们的工作和生活带来较大影响。

多举措减少“幻觉”

为进一步提升AI的精确度，科学家正想方设法降低其“幻觉”。

此外，使用更大、更干净的数据集进行训练，也是降低AI模型“幻觉”出现的有效途径。然而，当前可用数据的有限性限制了这一方法的应用。

点击展开全文

本文链接：http://www.gihot.com/news-2-375-0.html生成式AI“幻觉”困境如何破解

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：标记速度、均匀性和多功能性超出以往，新技术可高效标记细胞蛋白质

下一篇：顶夸克遵循狭义相对论通过最强测验

为你推荐

创客匠人老蒋、原爱多VCD创始人胡志标畅谈企业之道

当下，IP成为了企业品牌发展的主旋律，而创始人IP更是企业品牌营销中常见的一个名词。2024年12月26日至28日，全球创始人IP领袖高峰论坛顺应时势，围绕“创...

01-21

2.71亿元！国美电器三日新增16条被执行人信息，昔日家电零售巨头资产负债率超148%，仍在自救

近日，国美零售（00493.HK）旗下子公司国美电器有限公司（简称“国美电器”）连续新增被执行人信息的动态引发关注。天眼查司法案件显示，1月2...

01-25

2024年辽宁筹措基本建设投资资金607亿元，创历史新高！

　　去年全年，我省加力实施积极的财政政策，强化政府投资支撑作用，筹措基本建设投资资金607亿元，带动全省固...

02-15

蓝色预警！辽宁部分地区有大风

　　中央气象台2月16日18时继续发布大风蓝色预警：　　预计，2月16日20时至17日20时，内蒙古中东部、辽宁、吉...

02-17

新一批消费券来袭 2025年消费市场再添新动力

　　研究发现，消费券能显著增加交易活跃程度，且对低收入人群增加消费，可以有明显的提振作用。但要让消费券发挥理想的效果，不仅要精准把握发放的时间节点，还要确保民众有稳定...

01-21

警惕电诈新手段！骗子如何通过NFC实施盗刷？

　　NFC是近场通信的简称，它是一种短距离的无线通信技术，能让电子设备在靠得很近的时候进行数据交换，这个距离一般在几厘米之内。　　刷公交卡、移动支付、电子门禁……日常...

01-21

岚图知音全球版 SUV 开启海外交付，挪威、瑞典、芬兰三国上市

1 月 24 日消息，岚图汽车 1 月 22 日宣布，岚图知音全球版开启海外交付，目前新车已经启程发运挪威，距离挪威、瑞典、芬兰三国同步上市发售仅 87 天。2024 年 12 月 19 日...

01-24

小鹏汽车进军爱尔兰、芬兰市场，未来 10 年海外销量占比 50%

1 月 31 日消息，据小鹏汽车官方，近日该公司先后在都柏林与赫尔辛基举办发布会，小鹏 G9 在芬兰登场，而小鹏 G6 在芬兰与爱尔兰同时亮相。▲ 图源小鹏汽车公众号在此之前，...

02-01

国产系列电影成市场主力军

　　胡建礼　　近年来，国产系列电影如雨后春笋般涌现，如《熊出没》系列、《唐人街探案》系列、《...

01-22

温以凡桑延是什么小说温以凡为什么叫温霜降？

温以凡桑延是什么小说？温以凡为什么叫温霜降？温以凡和桑延是小说《难哄》中的主要角色。‌这部小说由竹已创作，讲述了温以凡和桑延之间的爱情故事。温以凡回到...

02-19

冬季儿童呼吸道疾病高发如何增强诊疗能力

　　进入冬季，呼吸道传染病高发，不少孩子也开始咳嗽、流鼻涕或高烧不退。最近在北京多家医院，儿科的就诊量有所增加。　　记者前不久...

01-21

21健讯Daily | 最高检披露2024医药行业反腐相关数据；诺和诺德司美格鲁肽注射液新适应症在中国申报上市

这里是《21健讯Daily》，欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件！政策动向最高检披露2024医药行业反腐相关数据2月12日...

02-14

探索陨石的奥秘 | 三桥街小学王馨涵

　　大家好,我是童学会小记者王馨涵。　　当流星划过夜空，除了赞叹他的美丽之外，你是否想过它背后的故事?带着这个好奇心，4月14日，我们来到了九紫宝藏陨石博物馆，探索陨石奥秘。...

01-21

济南高新区玺悦幼教集团（玺悦园、空港园、临港园）开展师德专题二次培训

　　大众网记者王一刚报道　　为进一步贯彻落实济南高新区教育文体部“三美”教师师德专题培训内容，加强师德师风建设，提升教师队伍素质，济南高新区玺悦幼教集团（玺悦园、...

01-21

盘点2024持牌消金（三）|“大家都在不遗余力强化自营”

　　中国网财经1月15日讯持牌消金进入纵深发展阶段后，在重塑业务模式的过程中，消费金融公司们既...

01-22

信托业积极服务经济社会

　　2024年12月30日，中国信托业协会发布《2023—2024中国信托业社会责任报告》（以下简称《报告》）...

01-24

水瓶男玩玩和动真情，水瓶男玩暧昧的表现

水瓶座的男生通常被认为是聪明、独立和善变的。他们对待感情的态度也常常让人摸不透，有...

01-22

巨蟹男考验你的7个步骤是什么样的

巨蟹座的男生通常被认为是情感细腻、善解人意的代表。然而，他们也有一些独特的方式来考...

01-22

长裤怎么搭配？男士棉麻长裤搭配？

长裤怎么搭配？男士棉麻长裤搭配？一、长裤怎么搭配？1. 长裤的搭配需要根据具体的场合、季节和身材等因素来决定，总的来说，需要考虑搭配的合理性、舒适性、时尚性和个性化等方面。...

02-07

女式黑色衬衫怎么搭配？

女式黑色衬衫怎么搭配？一、女式黑色衬衫怎么搭配？1，搭一件米色，或者白色的外衣。把黑色的领子折出来，这样看起来就不单调，如果单是一身黑的话，就显得很单调了。2，或者找很帅气的皮带...

02-17

苏宁易购将于2月14日上线6000元以上手机补贴

2月13日消息，苏宁易购宣布全面启动“6000元以上手机补贴计划”，2月14日至3月16日期间，针对6000元以上机型追加250-1000元补贴，每人限购一台，苏宁易购全国直营店可用。2月14日零点...

02-14

段永平最新千亿持仓数据：加仓拼多多、阿里巴巴

2月15日消息，段永平在美国管理的一个投资账户“H&H International Investment”提交的最新数据显示，截至2024年四季度，段永平持有8只美股，持仓市值145.16亿美元，约合人民币1053亿...

02-16

京东宣布为外卖骑手缴纳五险一金

2月19日消息，京东宣布，自2025年3月1日起，京东将逐步为京东外卖全职骑手缴纳五险一金，为兼职骑手提供意外险和健康医疗险。继给快递小哥缴纳五险一金后，京东再次成为首个为外卖骑...

02-20

京东外卖只准成功，刘强东已经开始推动大额补贴

1.京东外卖上线大额补贴这次京东入局外卖市场，真是拿出了破釜沉舟的拼劲。这不，继全额承担外卖骑手五险一金所有成本后，京东又给外卖消费者送上了大额补贴福利。2月27日，京东外...

03-01

小红书1500万在杭州成立新公司

【#小红书1500万在杭州成立新公司# #小红书新公司叫棋行科技#】天眼查App显示，近日，棋行科技（杭州）有限公司成立，法定代表人为张雷，注册资本1500万人民币，经营范围含社会经济咨询服...

01-21

福州市勘测院等成立空域领航科技公司

【#福州市勘测院等成立空域领航科技公司# 含航空运营支持服务】天眼查App显示，近日，福州市空域领航科技有限公司成立，法定代表人为吴建，注册资本5000万人民币，经营范围包括信息系...

02-09

CRPG《开拓者：拥王者》全球销量超过200万份

发行商 Knight Peaks 和开发商 Owlcat Games 宣布，CRPG游戏《开拓者：拥王者》在推出 6 年后，已突破 200 万销量大关。游戏于去年 9 月正式迎来了 6 周年纪念日，...

01-28

南美地区部分国家Nintendo Switch Online价格上涨

任天堂宣布对Nintendo Switch Online服务进行涨价，但仅涉及拉丁美洲部分地区。此次价格调整将于今年3月实施。任天堂今日开始向用户发送有关价格变动的邮件。...

02-01

武汉八办新春集市活动人气爆棚：有“吃”有“玩”还有“变脸”！

极目新闻通讯员凌丽万“巳”大“集”闹新春，非遗技艺过大年。2月3日，正月初六，又恰逢二十四节气之首“立春”，为庆祝首个“非遗版”春节，弘扬中华优秀传统文化，寄托岁首美好期盼，...

02-04

南极秦岭站一岁啦~看看一年来它交出了怎样的科研成绩单？

南极秦岭站是新时代我国建成的第一个常年科考站，今天（2月7日）是秦岭站开站一周年的日子。这座最新的考察站目前的建设进展怎么样？目前，中国第41次南极考察队已经高效完成了全部卸...

02-07

全部导航

生成式AI“幻觉”困境如何破解

五部门加强集中用餐单位食堂承包经营食品安全管理

完美世界遭遇转型阵痛：关停4个项目、优化2个项目，欲靠《诛仙世界》翻身？

北京、上海等地完成全国不动产登记区块链试点应用

年涨387%！“2024年股王”寒武纪有望单季度扭亏，其他芯片厂商表现如何？

燃！中国“人造太阳”创造“亿度千秒”世界纪录

单细胞代谢物分析质谱仪获国际首台（套）认定

超导直线等离子体装置“赤霄” 建成投运

栀子花提取物有助神经再生