生成式AI“幻觉”困境如何破解

1年前 来源:中国科技网 观看:171

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。30p即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。30p即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊30p即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。30p即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。30p即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。30p即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。30p即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验30p即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。30p即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。30p即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。30p即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。30p即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”30p即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。30p即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。30p即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。30p即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。30p即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。30p即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。30p即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。30p即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。30p即热新闻——关注每天科技社会生活新变化gihot.com

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。30p即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。30p即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊30p即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。30p即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。30p即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。30p即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。30p即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验30p即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。30p即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。30p即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。30p即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。30p即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”30p即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。30p即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。30p即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。30p即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。30p即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。30p即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。30p即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。30p即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。30p即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-375-0.html生成式AI“幻觉”困境如何破解

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:标记速度、均匀性和多功能性超出以往,新技术可高效标记细胞蛋白质

下一篇:顶夸克遵循狭义相对论通过最强测验

为你推荐
1月20日,我国首款起飞重量5.25吨、最大载重1.9吨的大型无人机鸿雁(HY100)在新疆石河子市天域航通石河子生产基地成功实现量产下线,其中3架顺利向客户完...
01-21
1月17日,记者从中国石化新闻办获悉,我国首套采用聚酯中黏工艺技术建设的50万吨/年瓶级切片装置在中国石化仪征化纤公司成功投产,标志着我国在聚酯非纤...
01-21
  【带你一起看大展】  光明日报记者周洪双李晓东  随着悠扬的里拉琴在四川成都金沙遗址...
01-21
针对即将到来的寒潮大风天气为保障海上人命安全1月24日天津海事局、辽宁海事局河北海事局、山东海事局...
01-27
新闻通讯员 王伟2025年1月20日,“国补”政策首次扩围至消费电子行业。对个人消费者购买华为手机、平板、智能手表手环等3类数码产品(单件销售价格不超过6000元),按产品销售价格...
01-21
  证券时报记者吴家明  “即将到来的春节假期,我们店里每天都有同事值班,现在已经对店里挂盘...
01-21
[本站 新车上市] 1月10日,特斯拉Model Y焕新版价格公布,共推出2款配置,售价分别为26.35万和30.35万。焕新Model Y首发版不仅拥有首发版标识,包括尾门徽章、迎宾灯徽章投...
01-21
1 月 21 日消息,美国东部时间 20 日中午,特朗普在国会大厦圆形大厅宣誓就任美国第 47 任总统。特朗普随后发表就职演讲,他在一项行政命令中表示,将下令其政府“取消电动...
01-22
近期,《重症外伤中心》备受关注,播出后引发了广泛讨论。这部剧中的一个关键情节是韩宥林对白江赫医生态度的转变。在剧中,白江赫医生凭借精湛的技术和冷静的态...
02-19
《难哄》段嘉许谁饰演?段嘉许和桑稚相隔多少岁?在电视剧《难哄》中,段嘉许由吴宇恒饰演。段嘉许和桑稚相隔多少岁原著:段嘉许出生于1989年,桑稚出生于1997年,两人...
02-19
  进入冬季,全国多地甲流病例数量明显增加。网络相关词条搜索量不断上升,不少网友表示已不幸“中招”。近日,山东省相关部门联合发布《冬春季呼吸道传染病防治健康提示...
01-21
21世纪经济报道记者 唐唯珂 广州报道“一到冬天就食欲大增,公司年会将近,想到要穿晚礼服就头大……现在打完一周之后,体重从76.6公斤掉到了74...
01-29
她师从图灵奖获得者 博士毕业于麻省理工学院 是国际知名企业的首席科学家 回...
01-21
  “如果不是郑皆连院士坚定的科学执言,‘世界第一拱’极有可能与我们擦肩而过。”这是广西大...
01-21
  中国证监会1月22日消息,近日,中央金融办等六部门联合印发的《关于推动中长期资金入市工作的实...
01-24
  摘要  【国际金价上演“狂飙”行情!华尔街交易商正“疯抢”黄金现货运往纽约】节后金价迭...
02-07
白羊座的男生通常充满活力、热情和冲动,他们喜欢追求刺激和新鲜感。如果你想让一个白羊...
01-22
射手座的男生通常被认为是自由奔放、热情洋溢的人,他们喜欢追求刺激和冒险,对于感情也是...
01-22
男生穿搭风格分类? 男生穿搭风格有哪些?一、男生穿搭风格分类?可以分为三大类分格,第一类,严谨,精致型,这一类比较喜欢高质量的牛仔裤,皮鞋,衬衣,西服套装,二类,是休闲类,嘻哈服装,夸张的...
02-22
170胖子穿搭男生秋季冬季?一、170胖子穿搭男生秋季冬季?170算中等身高吧,当然也会有腿偏短的情况,看个人的实际身材体型了。秋冬季的搭配选择还是挺多的,秋天相对来说会比较凉快...
02-22
1月20日消息,截至2024年12月底,1688PLUS会员数已突破1000万。1688PLUS会员是1688在2022年6月面向买家推出的付费会员产品,开卡即可获得商品价格优惠、平台红包补贴及官方专享服...
02-07
黄峥:“在正确的方向上逐步前进,远比在不正确的方向上狂奔要好。”1.拼多多申请“多多剧场”等商标家庭主妇被贬低,转手掏出整套护肤水乳,随便一抹就变身都市丽人;过年被家长安排...
02-09
2月27日,九号公司(689009.SH)发布2024 年年度业绩快报。报告期内,该公司营业总收入为141.71亿元,同比增长38.63%;归母净利润10.88亿元,同...
03-01
2月27日消息,智能支付网络平台Thunes宣布将其直连的全球网络(Thunes’ Direct Global Network)扩展至台湾市场,新举措将Thunes的Pay-to-Banks银行支付功能引入该地区,进一步提升...
03-01
2024年国网全年电网投资首超6000亿元,预计达到6092亿元,相比2023年新增711亿元,13.2%的同比增速也为近年最高值。据国网1月15日发布的信息显示,2025年国网将进一步加大投资力度,...
01-22
近日,珠海市合心财税科技有限公司(简称“财税科技”)迎来了重要的发展里程碑。公司宣布,已完成5000万元人民币的融资,由中经金控投资有限公司(以下简称...
02-07
《绝地潜兵2》的开发商箭头游戏工作室在过去一年里,因其由游戏策划主导的剧情而备受关注。为纪念《绝地潜兵2》发布一周年,极为神秘的游戏策划J.O.E.L.首次在一...
02-10
《天国:拯救2》虽然有一些争议,但这并没有阻止游戏深受广大玩家的喜爱。该作首发24小时销量破百万,仅用了一天时间就收回了4100万美元的成本。 更能说明的是,《天...
02-10
当地时间2月2日,美国国家运输安全委员会发表声明称,该机构目前已派遣工作人员抵达费城坠机事故的现场参与调查。截至2日下午,费城坠机事故的受伤人数已增至22人,5名伤者仍在住院...
02-03
国家医保局消息,长期护理保险自2016年启动试点八年来,全国49个城市试点工作稳步推进,阶段目标已基本实现。截至2024年底,全国超过1.8亿人参保,累计超过260万人享受待遇,基金支出超...
02-07
SQL Error: select * from ***_ecms_news1 where id in(275,,107,119,93,134,137,30) limit 8
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮