生成式AI“幻觉”困境如何破解

6个月前 来源:中国科技网 观看:93

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。tcl即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。tcl即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊tcl即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。tcl即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。tcl即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。tcl即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。tcl即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验tcl即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。tcl即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。tcl即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。tcl即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。tcl即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”tcl即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。tcl即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。tcl即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。tcl即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。tcl即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。tcl即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。tcl即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。tcl即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。tcl即热新闻——关注每天科技社会生活新变化gihot.com

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。tcl即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。tcl即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊tcl即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。tcl即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。tcl即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。tcl即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。tcl即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验tcl即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。tcl即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。tcl即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。tcl即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。tcl即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”tcl即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。tcl即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。tcl即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。tcl即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。tcl即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。tcl即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。tcl即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。tcl即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。tcl即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-375-0.html生成式AI“幻觉”困境如何破解

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:标记速度、均匀性和多功能性超出以往,新技术可高效标记细胞蛋白质

下一篇:顶夸克遵循狭义相对论通过最强测验

为你推荐
新华社合肥1月20日电(记者徐海涛、陈诺)“998、999、1000……”大屏幕上的数字最终定格在1066,原本安静的控制大厅一片欢呼。1月20日,我国...
01-21
美国加州大学伯克利分校和韩国高丽大学科学家携手,从变色龙身上获得灵感,研制出一种新型电磁材料。这种材料能够模仿变色龙的变色机制,按需在吸收、传...
01-24
  近日,省商务厅发布《辽宁省手机、平板、智能手表(手环)购新补贴实施细则》(以下简称《实施细则》),明确补...
01-22
  在欧莱雅、宝洁、花王、爱茉莉太平洋等跨国美妆巨头的最新财报上,业绩再现高增长:有的全球业...
02-11
  近4000元买新鞋却收到二手货  跳转平台无显著提醒,申请退货退款遭拒维权难  本报记者 郑朕  近日,市民吴女士向解放日报“民声直通车”平台反映,去年8月,她在网购...
01-21
会议现场 红网时刻新闻1月21日讯(记者陈奥男 刘志雄)今天,2025年全省商务工作会议暨扩消费工作推进会在长沙召开。记者从会上获悉,2025年湖南力争社会消费品零售总额增长5.5%...
01-22
1 月 22 日消息,据特斯拉官方微博,特斯拉现已在其Tesla App官方商城中上架椒盐瓶套组 / 蛇年双肩背包 / 高尔夫伞等配件,整理具体商品如下:特斯拉椒盐瓶套组定价:239元官...
01-23
2 月 6 日消息,福特 CEO 吉姆・法利在当地时间周三的财报电话会议上表示,增程电动汽车将在美国市场发挥重要作用,原因很简单:“美国人喜欢大车,尤其是大皮卡。”增程电动...
02-06
  《难哄》桑延和温以凡的爱情之路并不顺遂,桑延给足了温以凡偏爱和安全感,才让对方接受自己。《难哄》桑延温以凡什么时候在一起?桑延也曾经被温以凡拒绝过,但他并没有因此...
02-14
电视剧《香草的每天》自开拍以来就受到了众多粉丝的关注。这次播出更是让许多粉丝激动不已,尤其是对于第20集的剧情介绍,大家都充满了好奇。在第20集中,白井向...
02-20
21世纪经济报道记者林昀肖 实习生苏洋 北京报道春节假期已临近结束,而假期复工后往往会感觉容易疲倦、难以集中精神、心神不定、失眠、胃口...
02-04
  不少网友在春节期间  开启了天天吃剩菜的生活  这样的“剩宴”安全吗?  哪些食物不适...
02-05
  大众网记者 隋宜笑 报道  12月26日,山东政法学院党委委员、副校长胡晓清,山东政法学院传媒学院党总支书记徐永青,山东政法学院传媒学院副院长常洪卫等一行5人到访山东...
01-21
  大众网记者 秦瑾 通讯员 吴悦 报道  12月19日,2024年度山东省数据要素发展大会暨可信数据空间建设启动会在山东大厦举行。齐鲁师范学院人工智能教育研究院研发的“...
01-21
  观点网讯:1月20日,汇贤产业信托宣布偿还贷款及其财务影响。  公告显示,于2025年1月20日,汇贤...
01-21
  偿付能力是对保险公司各类风险的综合判断,偿付能力监管是预警和监测保险业风险的重要抓手。...
01-23
在一段感情中,了解对方的内心世界是非常重要的。而通过一些必问问题,可以考验男朋友在你...
01-22
射手座的男生喜欢自由和冒险,他们热爱探索未知的领域,追求刺激和新鲜感。如果你想增进与...
01-22
穿搭化妆风格? 菲律宾穿搭风格?一、穿搭化妆风格?每个人的气质不同,在穿搭上有很多种风格,所以,妆容方面也是有很多风格的。那么,接下来我们一起来看看妆容有哪些风格吧!感兴趣的朋...
02-07
那些在古装剧中美丽动人的女明星们提到古装剧,大家脑海中往往浮现出那些华丽的服饰、动听的音乐和传奇的故事。然而,在这一切的光鲜背后,无疑是那些女明星们令人惊艳的扮相。古...
02-07
网约车市场正在悄然发生变化,如同暴风雨来临前的宁静,让人恐惧。1、抖音上线打车服务抖音不仅能刷短视频,现在还能直接打车了。据Tech星球独家消息,抖音在近日上线了打车服务,入...
02-07
2月10日消息,携程商旅获得茶百道颁发的“2024年度优秀供应商”奖项。图源:公众号“携程商旅资讯号”据了解,作为国民级茶饮品牌,茶百道发源于“天府之国”,以“好茶为底,制造新鲜...
02-11
2月27日消息,抖音生活服务举办“服务体验与治理开放日”,发布《2024抖音生活服务消费者权益保护年度报告》,公布了过去一年在消费者权益保障与生态治理方面的措施和阶段性成果...
03-01
来源:图虫 3月3日,《长安的荔枝》发布首支预告及海报,并官宣...
03-04
1月18日,游族网络2025年会“U-nite U-show——游秀之夜”在上海西岸穹顶艺术中心成功举办。本次年会主题意为“聚在一起,秀出自己”,一方面象征着这是以每位优秀的游族人为主角...
01-21
根据一份流传到网上的内部公告,1月24日,完美世界开除了百万工作室四人,其违规行为包括在素材制作外包管理方面玩忽职守,构成严重失职;利用公司资源、谋取利益,涉及金额巨大;内外相...
02-09
即便索尼终于放松了其主机独占游戏的策略,将越来越多的游戏带到 PC 上,但这家公司依然不愿意放开其将更多人带到自家平台 PSN 上的策略:即便像是《地平线:西之绝境...
01-24
任天堂宣布对Nintendo Switch Online服务进行涨价,但仅涉及拉丁美洲部分地区。此次价格调整将于今年3月实施。 任天堂今日开始向用户发送有关价格变动的邮件。...
02-01
今年以来,黄金价格持续呈现上涨趋势。最近几天,国际金价屡创新高,金饰品的价格也随之上涨。现在黄金市场的整体情况怎么样?记者第一时间来到黄金市场进行探访。在全国最大的黄金...
02-08
极目新闻记者 陈倩摄影记者 刘中灿“我们军工人真不容易。他们(指黄旭华和同事们)是搞水下的,比我们更艰难。”2月9日,在吊唁黄旭华的现场,中船集团701所的退休职工许志同深有感...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮