生成式AI“幻觉”困境如何破解

3个月前 来源:中国科技网 观看:22

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。gzj即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。gzj即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊gzj即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。gzj即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。gzj即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。gzj即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。gzj即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验gzj即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。gzj即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。gzj即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。gzj即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。gzj即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”gzj即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。gzj即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。gzj即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。gzj即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。gzj即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。gzj即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。gzj即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。gzj即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。gzj即热新闻——关注每天科技社会生活新变化gihot.com

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。gzj即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。gzj即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊gzj即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。gzj即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。gzj即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。gzj即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。gzj即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验gzj即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。gzj即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。gzj即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。gzj即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。gzj即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”gzj即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。gzj即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。gzj即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。gzj即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。gzj即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。gzj即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。gzj即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。gzj即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。gzj即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-375-0.html生成式AI“幻觉”困境如何破解

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:标记速度、均匀性和多功能性超出以往,新技术可高效标记细胞蛋白质

下一篇:顶夸克遵循狭义相对论通过最强测验

为你推荐
半导体行业并购又来了。1月21日,快充芯片龙头南芯科技(688484.SH)发布公告,拟以不超过1.6亿元人民币现金收购珠海昇生微电子有限责任...
01-23
  记者从西藏自治区文物保护研究所获悉,我国联合考古队员历时5年发掘的玛不错遗址为目前青藏高...
01-24
  受益于亚冬会带来的冰雪经济新热度,滑雪服、羽绒服、滑雪手套等装备的销量在这个冬天迎来了一波新增...
02-15
  研究发现,消费券能显著增加交易活跃程度,且对低收入人群增加消费,可以有明显的提振作用。但要让消费券发挥理想的效果,不仅要精准把握发放的时间节点,还要确保民众有稳定...
01-21
  国家医保局:我国医保基金安全可持续  中新网1月17日电 国家医保局1月17日召开的新闻发布会上介绍,2024年我国医保基金收支平衡、略有结余,医保基金安全可持续。医保基金...
01-21
[本站 国内谍照] 1月18日,我们从相关渠道获取到了一组疑似吉利银河旗下全新轿车的路试谍照。从多处细节来看,该车或将归属星舰系列的全新插混车型,从而与星舰7 EM-i等车...
01-21
1 月 22 日消息,汽车媒体 ShortsCar 昨日(1 月 21 日)在 Instagram 上发布动态,抓拍到了现代 IONIQ 6 首批 P1 原型车的照片。这款流线型电动轿车改头换面,前脸重新设计,...
01-23
近期上映的电视剧《情薄似秋云,红颜洽春风》自播出以来,迅速赢得了众多观众的喜爱,许多人沉迷于剧情无法自拔。该剧由演员于珂然和江潼主演,每天18:00在山海剧...
02-19
《难哄》苏浩安是什么角色?苏浩安第几篇出场?苏浩安是男主桑延的好兄弟,与桑延从初中就相识,后来还考上了同一所高中,也是女主温以凡的朋友。他是一个富二代,有着...
02-19
21世纪经济报道记者闫硕 北京报道1月17日上午,由中国肥胖联盟和广东省二十一世纪教育基金会共同主办的关于《柳叶刀-糖尿病与内分泌学》重...
01-21
  在探索生命奥秘的领域,干细胞研究取得了令人瞩目的成就。自1932年干细胞相关研究问世以来,历...
02-14
SQL Error: select * from ***_ecms_news7 where id in(,34) limit 2
  近日,由元保集团(以下简称“元保”)和清华大学五道口金融学院中国保险与养老金融研究中心联合...
01-22
  本报记者 熊悦  金价持续攀高之际,已有商业银行下调黄金账户业务(即“积存金”,以下统称“积...
02-11
天秤男是十二星座中最具魅力的一种类型,他们温文尔雅、风度翩翩,总能吸引众多女性的目光...
01-22
射手座的男生通常被认为是自由奔放、热情洋溢的人,他们喜欢追求刺激和冒险,对于感情也是...
01-22
日系穿搭特点?一、日系穿搭的特点在穿搭方面日系风简直把休闲做到了极致,要说亚洲潮流文化发祥地,原宿绝对是一大圣地这里除了有常见的时尚大牌,还有亲民的牌子,日系穿搭的主要特...
02-07
浅色牛仔衬衫搭配什么裤子好看?一、浅色牛仔衬衫搭配什么裤子好看?浅色牛仔衬衫搭配黑色裤子好看。黑色裤子显得非常有气场,清新的浅色牛仔衬衫搭配成熟性感的黑色裤子。性感帅...
02-07
这两位来自福建龙岩的老乡,故事就此拉开序幕。1.抖音生活服务春节团购订单量暴涨春节放假期间,本地消费需求暴涨,让抖音狠狠地吃了一波红利。日前,抖音生活服务发布《2025春节消...
02-07
2月11日消息,深圳硬之城信息技术有限公司(以下简称"硬之城")近日宣布完成1.5亿元C2轮融资,本轮由北京知来投资、安徽江南产投、北京含元资本等机构联合投资。作为全球新硬件企业...
02-11
需求降温,飞天茅台、红花郎红10等价格下跌春节前后,受需求...
02-21
近日,有网友陆续在社交平台发帖称,在专门销售平价商品的两元店里发现一些网红品牌粉扑在售,售价2元左右。而相关产品在品牌官方渠道...
02-21
扬州无界矩阵科技有限公司(简称“无界矩阵”)近期以亿级估值完成超千万元天使轮融资,本轮融资由力合金融领投。无界矩阵是一家成立于2024年的人工智...
02-07
根据一份流传到网上的内部公告,1月24日,完美世界开除了百万工作室四人,其违规行为包括在素材制作外包管理方面玩忽职守,构成严重失职;利用公司资源、谋取利益,涉及金额巨大;内外相...
02-09
RTX 50系列显卡极度缺货,但第一批抢到的也不完全是幸运儿,网上已经有多起RTX 5090D/5090变砖的反馈,普遍和最新驱动有关,但目前尚无权威说法和官方回应,还得等后续...
02-06
发行商Hooded Horse近日宣布,中古时期策略游戏《庄园领主》销量已突破300万份,官方对玩家的支持表示了衷心感谢。 《庄园领主》最初于2024年4月26日在Steam上发...
02-10
2月8日,哈尔滨亚冬会自由式滑雪女子U型场地技巧决赛,中国选手李方慧、张可欣包揽金银牌!中国选手李方慧凭借第三轮95.25分的成绩夺得金牌,这是中国代表团在哈尔滨亚冬会夺得的首...
02-08
极目新闻记者 张盼在仙桃白马救人事件后,再现“钓鱼侠”。2月6日,钓鱼博主“土豆张”在社交平台发布的一段视频,引发网友关注,视频中众人用鱼竿、渔网救起一名落水者,评论区纷纷...
02-09
SQL Error: select * from ***_ecms_news1 where id in(73,,60,23,146,132,248,3) limit 8
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮