生成式AI“幻觉”困境如何破解

1年前 来源:中国科技网 观看:166

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。dLh即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。dLh即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊dLh即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。dLh即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。dLh即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。dLh即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。dLh即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验dLh即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。dLh即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。dLh即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。dLh即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。dLh即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”dLh即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。dLh即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。dLh即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。dLh即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。dLh即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。dLh即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。dLh即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。dLh即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。dLh即热新闻——关注每天科技社会生活新变化gihot.com

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。dLh即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。dLh即热新闻——关注每天科技社会生活新变化gihot.com

主因是数据模糊dLh即热新闻——关注每天科技社会生活新变化gihot.com

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。dLh即热新闻——关注每天科技社会生活新变化gihot.com

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。dLh即热新闻——关注每天科技社会生活新变化gihot.com

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。dLh即热新闻——关注每天科技社会生活新变化gihot.com

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。dLh即热新闻——关注每天科技社会生活新变化gihot.com

多领域面临考验dLh即热新闻——关注每天科技社会生活新变化gihot.com

AI的“幻觉”可能会给人们的工作和生活带来较大影响。dLh即热新闻——关注每天科技社会生活新变化gihot.com

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。dLh即热新闻——关注每天科技社会生活新变化gihot.com

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。dLh即热新闻——关注每天科技社会生活新变化gihot.com

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。dLh即热新闻——关注每天科技社会生活新变化gihot.com

多举措减少“幻觉”dLh即热新闻——关注每天科技社会生活新变化gihot.com

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。dLh即热新闻——关注每天科技社会生活新变化gihot.com

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。dLh即热新闻——关注每天科技社会生活新变化gihot.com

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。dLh即热新闻——关注每天科技社会生活新变化gihot.com

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。dLh即热新闻——关注每天科技社会生活新变化gihot.com

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。dLh即热新闻——关注每天科技社会生活新变化gihot.com

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。dLh即热新闻——关注每天科技社会生活新变化gihot.com

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。dLh即热新闻——关注每天科技社会生活新变化gihot.com

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。dLh即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-375-0.html生成式AI“幻觉”困境如何破解

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:标记速度、均匀性和多功能性超出以往,新技术可高效标记细胞蛋白质

下一篇:顶夸克遵循狭义相对论通过最强测验

为你推荐
荣耀高层变动终于靴子落地?据媒体报道,1月17日消息,荣耀终端股份有限公司内网发布公告称:“赵明因身体原因,向公司提出辞去CEO等相关职...
01-21
海军054B护卫舰首舰漯河舰1月22日上午在山东青岛某军港交接入列。10时许,入列授旗仪式开始,全场高唱中华人民共和国国歌,五星红旗冉冉升起。仪仗礼兵...
01-23
  第二届俄罗斯食品文化周(俄罗斯制造)活动19日在沈阳启幕,来自俄罗斯120余家厂商的1000余种“俄式”年...
01-21
  2月11日夜间我省中东部地区出现中雪到大雪,沿海地区出现雨雪转换、局部中雪,并伴有大风天气。全省平...
02-13
▲资料图:2022年,公安部门抓获私设电网违法行为人现场。图/天门公安社交账号截图据华商报大风新闻报道,1月14日凌晨,在湖北武汉江夏区,23岁大三学生小冉不幸遭私设的捕兽电网电击...
01-21
  中新经纬1月21日电 “中国铁路”微信号21日发文提示称,一些“抢票软件”推出“加速包”服务是营销噱头,实际上旅客加钱并不会提高购票速度。  国铁集团表示,1月21日开始...
01-21
在全球汽车产业风起云涌的变革浪潮中,中国汽车品牌正以坚定的步伐和昂扬的姿态,向世界展示着中国力量。1月22日,一场以“心所向,自纵横”为主题的盛会在北京国家会议中心隆重举...
01-24
1 月 29 日消息,特斯拉公司宣布,其 Cybertruck 车主现在可以在所有 V4 超级充电站享受更快的充电速度。此前,特斯拉于上个月开始逐步推出这一快速充电功能。1 月 28 日...
01-29
  1、《树下有片红房子》宋丛官配是祁琪,祁琪从很早就开始喜欢宋丛了,两人后来走到了一起。  2、小说中祁琪和宋丛的结局不太美好,但是剧里面宋丛只跟祁琪谈过恋爱,两人也...
02-18
最近热播的《大梁第一女仵作》受到许多观众的喜爱,大家不仅追剧热情高涨,还对情节和人物充满好奇。为了让大家更全面地了解这部电视剧,这里整理了一些相关信息...
02-19
  进入冬季,呼吸道传染病高发,不少孩子也开始咳嗽、流鼻涕或高烧不退。最近在北京多家医院,儿科的就诊量有所增加。   记者前不久...
01-21
21世纪经济报道记者 闫硕 北京报道HPV是一种易感染人体表皮和黏膜鳞状上皮的病毒,已被发现有两百多种型别,根据致癌性的不同分为高危型别和...
02-18
  大众网记者 王一刚 报道  进入大班后,孩子们对探索自己身体秘密的情感越来越强烈。在一次手掌拓印活动中,孩子们对手上的指纹产生了浓厚的兴趣,在好奇心的推动下,孩子...
01-21
  大众网记者 司心鹏 通讯员 邱文风 王琴 报道  12月5日,山东商业职业技术学院云计算技术与应用产业学院党总支与浪潮软件股份有限公司党委开展了“党建引领聚合力,双...
01-21
  摘要  【国际金价上演“狂飙”行情!华尔街交易商正“疯抢”黄金现货运往纽约】节后金价迭...
02-07
  近期,江西、湖北等地的中小银行增资扩股方案获得当地金融监管部门的批复同意。相比往年,此轮...
02-11
白羊座的男生通常充满活力、热情和冲动,他们喜欢追求刺激和新鲜感。如果你想让一个白羊...
01-22
天秤男是一个非常浪漫和温柔的星座,他们对爱情充满了向往和幻想。当一个天秤男开始动情...
01-22
冬季男穿搭? 1、英伦绅士风  英伦风打扮的关键特性就是说精美、修身养性。在严寒的冬天,一套打扮得当的英伦风服装,将你的绅士精美反映得酣畅淋漓。  搭配技巧:英伦绅士风...
02-07
十大服饰品牌是什么?世界十大服饰品牌:1、唐纳・卡兰唐纳・卡兰(donnakaran)的创始人是一个外表平和貌不惊人的女子,为了使其服饰王国走向多元化,在1984年和丈夫联手创立了自己的...
02-12
小红书宣布开始招募海外MCN机构,批量引入具备视频创作能力的海外红人。MCN机构将有三个月试跑期,需承诺每个月不少于50人的红人引入量。今年1月中旬,受TikTok在美关停影响,自称...
02-11
2月14日消息,苏宁易购与美的召开2025年度战略合作会议,加力投入以旧换新。锚定年度200亿战略目标,双方将深化联合创新、服务体验、终端运营等方面合作,上新超70款新品。抢滩春季...
02-15
3月2日消息,京东健康旗下“京医千询”医疗大模型近日启动开源,成为国内医疗行业首个全面开源的垂类大模型。同时,在2月24日更新的MedBench评测榜单上,“京医千询”医疗大模型以...
03-03
法国作家罗曼·罗兰曾说:“没有一场深刻的恋爱,人生等于虚度一场。”爱情自古以来是人类追求、渴望的情感之一,人们在它带来的诗意与...
03-04
【#平安产险成立轩坤股权投资合伙企业# 出资额100亿】天眼查App显示,近日,嘉兴轩坤股权投资合伙企业(有限合伙)成立,执行事务合伙人为平安创赢资本管理有限公司,出资额100亿人民币...
01-21
近日,南京众智维信息科技有限公司(以下简称“「众智维科技」”)完成数千万B1轮融资。本轮融资由广州白云金融控股集团有限公司及北京泓沣私募基金管...
02-07
美少女桌面助理软件《战盟桌面精灵》第一个服装DLC,于2025年1月22日正式上线。此次更新将会为“夏晴”增加一套春节主题时装,邀你一同欢庆新年! 巳岁平安,蛇年大...
01-24
开发了《英雄连》和《战争40K:战争黎明》等游戏的开发商 RelicEntertainment 去年 5 月与世嘉分道扬镳。公司日前概述了其作为独立工作室的未来计划。 Relic ...
02-12
2025年春节是“春节——中国人庆祝传统新年的社会实践”列入联合国教科文组织人类非物质文化遗产代表作名录后的首个春节。文化和旅游部组织开展“欢欢喜喜过大年”春节主题...
02-05
2月8日,哈尔滨亚冬会自由式滑雪女子U型场地技巧决赛,中国选手李方慧、张可欣包揽金银牌!中国选手李方慧凭借第三轮95.25分的成绩夺得金牌,这是中国代表团在哈尔滨亚冬会夺得的首...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮