生成式AI“幻觉”困境如何破解

9个月前 来源:中国科技网 观看:114

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。aTA即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。aTA即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊aTA即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。aTA即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。aTA即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。aTA即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。aTA即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验aTA即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。aTA即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。aTA即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。aTA即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。aTA即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”aTA即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。aTA即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。aTA即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。aTA即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。aTA即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。aTA即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。aTA即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。aTA即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。aTA即热新闻——关注每天科技社会生活新变化gihot.com

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。aTA即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。aTA即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊aTA即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。aTA即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。aTA即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。aTA即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。aTA即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验aTA即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。aTA即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。aTA即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。aTA即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。aTA即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”aTA即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。aTA即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。aTA即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。aTA即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。aTA即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。aTA即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。aTA即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。aTA即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。aTA即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-375-0.html生成式AI“幻觉”困境如何破解

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:标记速度、均匀性和多功能性超出以往,新技术可高效标记细胞蛋白质

下一篇:顶夸克遵循狭义相对论通过最强测验

为你推荐
央视网消息:近日,中央社会工作部等8部门联合出台措施,指导加强快递员、网约配送员服务管理,推动构建和谐劳动关系,切实维护各方合法权益。措施提出,推进...
01-21
记者1月23日从三峡集团获悉,我国首艘内河大型清洁能源滚装船——川江清洁能源滚装船项目首艘船舶在湖北省秭归县正式下水。该船总长129.8...
01-24
好消息!辽宁省手机、平板、智能手表(手环)购新补贴实施细则来啦每人每类可补贴1件每件最高补贴不超过500元...
01-21
注意啦沈阳市皇姑区、浑南区面向社会公开招聘博士人才事业单位编制发放生活补贴提供住房保障为随迁家属...
02-14
  中新经纬1月17日电 (闫淑鑫)“2025年,数字化技术将加速驱动文化产业进一步发展,数字化技术(如人工智能)在内容创作、传播和消费中的应用将更加广泛。”近日,泰中侨商联合会...
01-21
2 月 5 日消息,丰田汽车公司(以下简称“丰田”)与上海市政府今日就共同助力中国社会绿色低碳发展相关举措达成合作意向。丰田决定在上海市金山区成立 LEXUS 雷克萨斯纯...
02-05
2 月 5 日消息,广汽埃安 AION UT 纯电小车将于 2 月底上市,该车上个月已开启预售,预售价格为 8.98 万元到 10.98 万元,99 元意向金抵 1000 元购车款。从此前官方介绍获...
02-06
《香草的每天》近期正在热播,播出后反响良好,网上热度持续上升,在各大论坛上也引发了热烈讨论。观众们尤其关注第19集的剧情。在这一集中,作为点心教室最后的学...
02-20
《难哄》是双男女主吗小说?难哄小说女主描述的是什么?《难哄》不是双女主小说,而是一部以温以凡和桑延为主角的现代言情小说。单女主设定:女主温以凡因家庭变故...
02-21
  进入冬季,全国多地甲流病例数量明显增加。网络相关词条搜索量不断上升,不少网友表示已不幸“中招”。近日,山东省相关部门联合发布《冬春季呼吸道传染病防治健康提示...
01-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向两部门:2025年底前 所有省份要将省内异地住院...
02-05
  大众网记者 杨涛报道  日前,“外研社·国才杯”“理解当代中国”全国大学生外语能力演讲大赛(山东赛区高职组)成绩揭晓,青岛港湾职业技术学院的王淑珍同学凭借出色的表...
01-21
作者:沈阳职业技术学院 王坤高校辅导员肩负着组织者、指导者和实施者的多重角色。在思政教育工作中,应...
01-22
  乌鲁木齐银行第三大股东深圳君豪集团有限公司所持有的4000万股股权即将于1月18日进行司法拍...
01-22
  两年三度冲刺港交所上市,宜宾银行(02596.HK)终于圆梦,但并未引起资本市场过多兴趣。  第一财...
01-22
天秤男是一个追求平衡和和谐的星座,他们善于处理人际关系,注重公正和公平。然而,在与天秤...
01-22
狮子座是十二星座中最具有领导力和自信心的一个星座。当他们爱上一个人时,会展现出一系...
01-22
光彩夺目的时尚盛宴:揭开模特T台走秀的神秘面纱在每一场时装周上,T台走秀总是那个最引人注目的焦点。随着聚光灯的闪烁,模特们如同仙女下凡般走上T台,然而,你是否想过,这背后隐藏...
02-07
掌握潮流:男士服饰搭配的5个必备技巧在这个追求个性的时代,男士服饰搭配越来越受到关注。作为一名对时尚有追求的男士,我经常会思考如何在众多潮流中找到适合自己的搭配方法。...
02-12
2月13日消息,常州同惠电子股份有限公司日前与京东工业品举行战略合作签约仪式,同惠电子董事长赵浩华与京东工业品副总裁郭晓博代表双方签署协议。图源:Tonghui同惠公众号根据协...
02-14
2月14日消息,中农网近日正式发布面向实际工作场景的智能助手AI小易(内测版),并完成满血版DeepSeek-R1与智能助手AI小易的接入。经过多次训练,AI小易已经具备了多文体写作支持、数...
02-14
2月19日消息,58同城发布返工就业大数据,春节后首周招聘市场强势回暖,2025年春节后首周(2月5日-12日),企业招聘需求环比节前(1月21日-27日)增长219%,求职需求较节前表现出倍数增长趋势...
02-20
2月21日消息,汽车之家日前发布公告,其大股东中国平安旗下云辰资本与海尔集团子公司卡泰驰控股签订协议,卡泰驰控股将以总价约18亿美元,收购云辰资本持有的汽车之家20亿股公司普...
02-22
“宁王”的港股IPO,终于要落地了。12月26日晚,宁德时代发布公告称,为进一步推进公司全球化战略布局,打造国际化资本运作平台,提高综合竞争力,公司拟发行...
02-07
近日,智能科技领域企业——青岛明邦智能科技有限公司(简称“明邦智能”)宣布,成功完成1000万元人民币的融资。此次融资由广东南方秭方投资集团(简称“...
02-07
《街头霸王6》联动角色不知火舞已上线。近日油管主GoGa No Commentary分享了不知火舞被全角色花式KO合集,妹子被各种虐打,让人心疼。一起来欣赏下视频吧! 视频欣...
02-10
曾在《魔兽世界》团队单人开发工作长达 13 年经验的开发者 Chris Kaleiki 最近接受了 GamesRadar+ 的采访,讨论了他所在的新工作室 Notorious Studios 的新作品...
02-10
“海上神器展锋芒,油气开发创辉煌”。今天说的神器就是中国制造的亚洲首艘圆筒型浮式生产储卸油装置(FPSO)——“海葵一号”。《渔舟唱晚》在民族音乐里可谓是鼎鼎有名。音乐一...
02-03
当地时间5日,乌克兰总统泽连斯基签署关于延长乌克兰战时状态和动员的法令,战时状态和总动员令将再延长90天至2025年5月9日。(总台记者 王斌)...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮