瞭望 | AI幻觉频现 风险挑战几何

3个月前 来源:新华网 观看:47

当前,人工智能技术快速发展,但大模型“自说自话”、一本正经“胡说八道”、生成偏离事实内容的问题日益凸显,这一现象被称为“AI幻觉”。不少业内人士提醒,由于大模型主要基于概率生成文本而非逻辑推理,在短期内难以完全避免此类问题。4C7即热新闻——关注每天科技社会生活新变化gihot.com

《瞭望》新闻周刊记者观察到,AI虚构事实或逻辑混乱的“幻觉”已在法律、内容创作、专业咨询等多个领域造成实际影响。4C7即热新闻——关注每天科技社会生活新变化gihot.com

AI技术的发展方兴未艾,但确保其生成内容的真实性和可靠性,尤其需要技术开发者、监管机构共同努力。针对“AI幻觉”问题,业界建议,在技术层面,要持续优化模型架构,增强事实核查能力;在监管层面,需完善相关规范,明确责任边界。4C7即热新闻——关注每天科技社会生活新变化gihot.com

幻觉频现4C7即热新闻——关注每天科技社会生活新变化gihot.com

“AI幻觉”已经成为当前AI技术发展中最突出的技术瓶颈之一。从技术层面来看,AI幻觉的产生主要源于三个方面的原因:首先是训练数据的不足或偏差,导致模型对某些领域的认知存在缺陷;其次是算法架构的局限性,当前主流大模型主要基于概率预测而非逻辑推理;最后是训练目标的设定问题,模型往往更倾向于生成“流畅”而非“准确”的内容。4C7即热新闻——关注每天科技社会生活新变化gihot.com

“AI幻觉主要表现为事实性幻觉和逻辑性幻觉两种。”业内人士介绍,事实性幻觉,表现为模型会编造完全不存在的事实或信息。这种情况在专业领域尤为突出,如在法律咨询中虚构判例,在医疗诊断中给出错误结论,或杜撰历史事件。逻辑性幻觉,表现为模型在长文本生成或连续对话中出现前后矛盾、逻辑混乱的情况,这主要是因为当前大模型的注意力机制在处理复杂语境时存在局限性。4C7即热新闻——关注每天科技社会生活新变化gihot.com

多项研究证实了AI幻觉问题的严重性。今年3月,哥伦比亚大学数字新闻研究中心针对主流AI搜索工具进行的专项测试发现,这些工具在新闻引用方面的平均错误率达到60%。一些研究显示,AI并不擅长辨别“新闻事实来自哪里”,会出现混淆信息来源、提供失效链接等问题。更令人担忧的是,随着模型规模的扩大,某些类型的幻觉问题不仅没有改善,反而呈现加剧趋势。4C7即热新闻——关注每天科技社会生活新变化gihot.com

多位业内专家认为,AI幻觉问题在现有技术框架下难以彻底解决。思谋科技联合创始人刘枢表示,当前的大模型架构决定了其本质上是一个“黑箱”系统,优化结构等方式只能缓解模型幻觉问题,很难完全避免幻觉的产生。4C7即热新闻——关注每天科技社会生活新变化gihot.com

有受访者从认知科学的角度分析,当前的大模型处于“我不知道我知道什么”的状态,缺乏对自身知识边界的准确判断能力。这些技术特性决定了AI幻觉问题的存在,需通过多方面的技术改进来逐步缓解。4C7即热新闻——关注每天科技社会生活新变化gihot.com

警惕风险4C7即热新闻——关注每天科技社会生活新变化gihot.com

业界普遍认为,在AI幻觉短期内难以完全消除的背景下,其潜在风险已从信息领域蔓延至现实世界,可能带来较大风险。4C7即热新闻——关注每天科技社会生活新变化gihot.com

世界经济论坛《2025年全球风险报告》已将“错误和虚假信息”列为全球五大风险之一,其中AI生成的幻觉内容被视作关键诱因之一。4C7即热新闻——关注每天科技社会生活新变化gihot.com

AI幻觉最直接的危害是造成“信息污染”。在法律领域,美国纽约南区联邦法院在审理一起航空事故诉讼时发现,原告律师提交的法律文书中引用了ChatGPT生成的6个虚假判例,这些虚构案例包括完整的案件名称、案卷号及法官意见,甚至模仿了美国联邦最高法院的判例风格,其虚构能力干扰了司法程序。4C7即热新闻——关注每天科技社会生活新变化gihot.com

金融咨询领域,AI可能给出错误投资建议,如误读财报数据或虚构企业信息。4C7即热新闻——关注每天科技社会生活新变化gihot.com

更令人担忧的是,这些错误信息可能被其他AI系统吸收,形成“幻觉循环”——错误数据不断被强化,最终污染整个信息生态。4C7即热新闻——关注每天科技社会生活新变化gihot.com

随着AI技术向实体设备领域渗透,幻觉问题的影响已超越虚拟范畴,可能对人身安全构成威胁。在自动驾驶领域,生成式AI被用于实时路况分析和决策制定。业内人士表示,在复杂路况中,自动驾驶若产生“感知幻觉”,可能导致系统误判环境,触发错误决策,直接威胁行车安全。4C7即热新闻——关注每天科技社会生活新变化gihot.com

人形机器人领域风险更值得关注。优必选副总裁庞建新说:“当机器人因幻觉做出错误动作时,后果远超文本错误。”例如,护理机器人可能误解指令给患者错误用药,工业机器人可能误判操作参数造成生产事故。这些场景中,AI幻觉甚至可能威胁人身安全。4C7即热新闻——关注每天科技社会生活新变化gihot.com

协同治理4C7即热新闻——关注每天科技社会生活新变化gihot.com

对于AI幻觉问题带来的挑战,业内人士建议从技术创新、制度监管等多个维度构建综合治理体系。4C7即热新闻——关注每天科技社会生活新变化gihot.com

技术创新是解决AI幻觉问题的根本途径。近年来,业界已提出多种技术方案来应对这一挑战。刘枢等介绍,检索增强生成(Retrieval-augmented Generation,RAG)技术融合了检索与生成模型优势,是当前重要的发展方向之一。其通过将大模型与权威知识库实时对接,能显著提升生成内容准确性。4C7即热新闻——关注每天科技社会生活新变化gihot.com

全国政协委员、360集团创始人周鸿祎提出“以模制模”,构建专业知识库,实施合理的矫正机制,构建更完善的安全防护体系,降低“幻觉”带来的负面影响。例如,研发专用的安全大模型来监督知识库使用和智能体调用,并采用多模型交叉验证、搜索矫正等技术手段来识别和纠正幻觉。4C7即热新闻——关注每天科技社会生活新变化gihot.com

制度监管方面需要建立多层次的治理体系。云天励飞品牌运营中心总经理胡思幸认为,要完善监管治理,研究AI生成内容“数字水印+风险提示”双重标识,为AI生成内容提供有效的溯源和警示机制。针对日益突出的AI造谣问题,法律界人士建议,要持续完善相关规定,明确利用AI造谣的法律责任,加大对违法行为的惩处力度。4C7即热新闻——关注每天科技社会生活新变化gihot.com

治理体系之外,当前阶段,在用户使用AI开展工作时,亦需要建立对AI能力的理性认知,了解其局限性。培养多渠道验证信息的习惯,优先选择权威、可信赖的媒体或机构作为信息来源,这些基本素养的提升将有效降低AI幻觉的社会影响。同时,在与AI系统交互时应保持必要的怀疑态度和批判思维,多渠道核查验证信息的准确性。4C7即热新闻——关注每天科技社会生活新变化gihot.com

当前,人工智能技术快速发展,但大模型“自说自话”、一本正经“胡说八道”、生成偏离事实内容的问题日益凸显,这一现象被称为“AI幻觉”。不少业内人士提醒,由于大模型主要基于概率生成文本而非逻辑推理,在短期内难以完全避免此类问题。4C7即热新闻——关注每天科技社会生活新变化gihot.com

《瞭望》新闻周刊记者观察到,AI虚构事实或逻辑混乱的“幻觉”已在法律、内容创作、专业咨询等多个领域造成实际影响。4C7即热新闻——关注每天科技社会生活新变化gihot.com

AI技术的发展方兴未艾,但确保其生成内容的真实性和可靠性,尤其需要技术开发者、监管机构共同努力。针对“AI幻觉”问题,业界建议,在技术层面,要持续优化模型架构,增强事实核查能力;在监管层面,需完善相关规范,明确责任边界。4C7即热新闻——关注每天科技社会生活新变化gihot.com

幻觉频现4C7即热新闻——关注每天科技社会生活新变化gihot.com

“AI幻觉”已经成为当前AI技术发展中最突出的技术瓶颈之一。从技术层面来看,AI幻觉的产生主要源于三个方面的原因:首先是训练数据的不足或偏差,导致模型对某些领域的认知存在缺陷;其次是算法架构的局限性,当前主流大模型主要基于概率预测而非逻辑推理;最后是训练目标的设定问题,模型往往更倾向于生成“流畅”而非“准确”的内容。4C7即热新闻——关注每天科技社会生活新变化gihot.com

“AI幻觉主要表现为事实性幻觉和逻辑性幻觉两种。”业内人士介绍,事实性幻觉,表现为模型会编造完全不存在的事实或信息。这种情况在专业领域尤为突出,如在法律咨询中虚构判例,在医疗诊断中给出错误结论,或杜撰历史事件。逻辑性幻觉,表现为模型在长文本生成或连续对话中出现前后矛盾、逻辑混乱的情况,这主要是因为当前大模型的注意力机制在处理复杂语境时存在局限性。4C7即热新闻——关注每天科技社会生活新变化gihot.com

多项研究证实了AI幻觉问题的严重性。今年3月,哥伦比亚大学数字新闻研究中心针对主流AI搜索工具进行的专项测试发现,这些工具在新闻引用方面的平均错误率达到60%。一些研究显示,AI并不擅长辨别“新闻事实来自哪里”,会出现混淆信息来源、提供失效链接等问题。更令人担忧的是,随着模型规模的扩大,某些类型的幻觉问题不仅没有改善,反而呈现加剧趋势。4C7即热新闻——关注每天科技社会生活新变化gihot.com

多位业内专家认为,AI幻觉问题在现有技术框架下难以彻底解决。思谋科技联合创始人刘枢表示,当前的大模型架构决定了其本质上是一个“黑箱”系统,优化结构等方式只能缓解模型幻觉问题,很难完全避免幻觉的产生。4C7即热新闻——关注每天科技社会生活新变化gihot.com

有受访者从认知科学的角度分析,当前的大模型处于“我不知道我知道什么”的状态,缺乏对自身知识边界的准确判断能力。这些技术特性决定了AI幻觉问题的存在,需通过多方面的技术改进来逐步缓解。4C7即热新闻——关注每天科技社会生活新变化gihot.com

警惕风险4C7即热新闻——关注每天科技社会生活新变化gihot.com

业界普遍认为,在AI幻觉短期内难以完全消除的背景下,其潜在风险已从信息领域蔓延至现实世界,可能带来较大风险。4C7即热新闻——关注每天科技社会生活新变化gihot.com

世界经济论坛《2025年全球风险报告》已将“错误和虚假信息”列为全球五大风险之一,其中AI生成的幻觉内容被视作关键诱因之一。4C7即热新闻——关注每天科技社会生活新变化gihot.com

AI幻觉最直接的危害是造成“信息污染”。在法律领域,美国纽约南区联邦法院在审理一起航空事故诉讼时发现,原告律师提交的法律文书中引用了ChatGPT生成的6个虚假判例,这些虚构案例包括完整的案件名称、案卷号及法官意见,甚至模仿了美国联邦最高法院的判例风格,其虚构能力干扰了司法程序。4C7即热新闻——关注每天科技社会生活新变化gihot.com

金融咨询领域,AI可能给出错误投资建议,如误读财报数据或虚构企业信息。4C7即热新闻——关注每天科技社会生活新变化gihot.com

更令人担忧的是,这些错误信息可能被其他AI系统吸收,形成“幻觉循环”——错误数据不断被强化,最终污染整个信息生态。4C7即热新闻——关注每天科技社会生活新变化gihot.com

随着AI技术向实体设备领域渗透,幻觉问题的影响已超越虚拟范畴,可能对人身安全构成威胁。在自动驾驶领域,生成式AI被用于实时路况分析和决策制定。业内人士表示,在复杂路况中,自动驾驶若产生“感知幻觉”,可能导致系统误判环境,触发错误决策,直接威胁行车安全。4C7即热新闻——关注每天科技社会生活新变化gihot.com

人形机器人领域风险更值得关注。优必选副总裁庞建新说:“当机器人因幻觉做出错误动作时,后果远超文本错误。”例如,护理机器人可能误解指令给患者错误用药,工业机器人可能误判操作参数造成生产事故。这些场景中,AI幻觉甚至可能威胁人身安全。4C7即热新闻——关注每天科技社会生活新变化gihot.com

协同治理4C7即热新闻——关注每天科技社会生活新变化gihot.com

对于AI幻觉问题带来的挑战,业内人士建议从技术创新、制度监管等多个维度构建综合治理体系。4C7即热新闻——关注每天科技社会生活新变化gihot.com

技术创新是解决AI幻觉问题的根本途径。近年来,业界已提出多种技术方案来应对这一挑战。刘枢等介绍,检索增强生成(Retrieval-augmented Generation,RAG)技术融合了检索与生成模型优势,是当前重要的发展方向之一。其通过将大模型与权威知识库实时对接,能显著提升生成内容准确性。4C7即热新闻——关注每天科技社会生活新变化gihot.com

全国政协委员、360集团创始人周鸿祎提出“以模制模”,构建专业知识库,实施合理的矫正机制,构建更完善的安全防护体系,降低“幻觉”带来的负面影响。例如,研发专用的安全大模型来监督知识库使用和智能体调用,并采用多模型交叉验证、搜索矫正等技术手段来识别和纠正幻觉。4C7即热新闻——关注每天科技社会生活新变化gihot.com

制度监管方面需要建立多层次的治理体系。云天励飞品牌运营中心总经理胡思幸认为,要完善监管治理,研究AI生成内容“数字水印+风险提示”双重标识,为AI生成内容提供有效的溯源和警示机制。针对日益突出的AI造谣问题,法律界人士建议,要持续完善相关规定,明确利用AI造谣的法律责任,加大对违法行为的惩处力度。4C7即热新闻——关注每天科技社会生活新变化gihot.com

治理体系之外,当前阶段,在用户使用AI开展工作时,亦需要建立对AI能力的理性认知,了解其局限性。培养多渠道验证信息的习惯,优先选择权威、可信赖的媒体或机构作为信息来源,这些基本素养的提升将有效降低AI幻觉的社会影响。同时,在与AI系统交互时应保持必要的怀疑态度和批判思维,多渠道核查验证信息的准确性。4C7即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3386-0.html瞭望 | AI幻觉频现 风险挑战几何

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:研究人员利用脑机接口尝试解码内心独白

下一篇:秀我中国|机器人自由搏击决赛“拳拳到铁”

为你推荐
1月9日,国家药品监督管理局发布最新药品获批证明文件,华润三九携手中国工程院院士张伯礼及团队研发的益气清肺颗粒正式获批上市。益气清肺颗粒是以古...
01-21
数字化时代,作为引领新一轮科技革命和产业变革的战略性技术,人工智能正在与各行各业深度融合,影响着人们生产和生活的方方面面。中央经济工作会议明确...
01-27
  “年到元宵灯火燃,龙腾狮舞夜难眠。”元宵节作为春节后的首个传统节日,气氛主打一个“闹”字,...
02-13
  受益于亚冬会带来的冰雪经济新热度,滑雪服、羽绒服、滑雪手套等装备的销量在这个冬天迎来了...
02-18
  春运期间,乘坐高铁动车组列车时,您会看到在座位上方、行李架的下方有一串圆点状指示灯,分为红、绿、黄三种颜色。这些指示灯是干什么用的?不同颜色指示灯代表什么意思?掌...
01-21
  开年A股第一宗并购!紫金矿业137亿元入主藏格矿业  1月16日,备受市场瞩目的2025年A股并购第一单落锤。  1月16日晚间,藏格矿业(000408.SZ)公告,紫金矿业(601899.SH)同步...
01-21
  近期,国家发展改革委和财政部发布了《关于2025年加力扩围实施大规模设备更新和消费品以旧换...
01-24
1 月 24 日消息,据“一汽红旗”官方公众号,一汽红旗宣布旗下天工系列全新电动中型车定名为天工 05,该车是红旗天工系列的首款轿车,官图称该车将于“新岁登场”,结合该车...
01-25
最新播出的《重症外伤中心》在各大短视频平台上引起了广泛关注。许多观众对韩宥林掌握的白江赫的秘密感到好奇。在医院的重症外伤中心,韩宥林冷静地坐在会议...
02-19
近期,电视剧《119紧急呼叫》在各大短视频平台上大受欢迎,特别是第6集的剧情引起了观众们的热烈讨论。以下是该集的主要内容。五年前,粕原雪告诉姐姐小夏她打算...
02-20
  乙巳新春佳节至,欢聚莫忘养生经。日前,国家中医药管理局举行新闻发布会,介绍春节期间中医药健康养生知识。  美食佳肴需有度  腊月里的民俗有道是:二十五,磨豆腐;二...
01-27
21世纪经济报道记者 闫硕 北京报道2月12日,根据中国生物微信公众号,近日,国药药材股份有限公司(以下简称药材股份)及其所属企业多次出现法律纠...
02-14
建设教育强国,龙头是高等教育。近日印发的《教育强国建设规划纲要(2024&mdas...
01-21
  大众网记者 王一刚 报道  在深化教育改革、全面提升教育质量的背景下,燕山小学教育集团积极响应国家号召,致力于探索并实施具有前瞻性和创新性的教育理念,以培养全面...
01-21
  摘要  【每日龙虎榜】豆油增仓近8万手,烧碱减仓2万余手,日内资金净流入86.15亿元。一文带你...
02-08
  车险作为财险业的第一大险种,其保费情况备受市场关注。随着险企2024年四季度偿付能力报告陆...
02-13
摩羯女是一个非常理性和实际的星座,她们对感情有着严格的要求和标准。如果你想追求一位...
01-22
双鱼座的男生通常是浪漫而敏感的,他们善于表达情感,但有时也会因为过于理想化而迷失自己...
01-22
冬季男穿搭? 1、英伦绅士风  英伦风打扮的关键特性就是说精美、修身养性。在严寒的冬天,一套打扮得当的英伦风服装,将你的绅士精美反映得酣畅淋漓。  搭配技巧:英伦绅士风...
02-07
揭秘北京T台走秀模特公司:行业内幕与精彩瞬间在灯光璀璨的T台上,模特们用自信的步伐和优雅的姿态为观众呈现了一场场视觉盛宴。作为北京这个时尚与文化交融的大都市,T台走秀模...
02-17
2月7日消息,百胜中国披露2024年第四季度及全年财务业绩。2024年第四季度,百胜中国总收入同比增长4%至26亿美元;经营利润同比增长36%至1.51亿美元;经营利润率为5.8%,同比增长140个...
02-07
2月19日消息,闲鱼公布了旗下AI产品最新的数据,目前,其全线AI产品闲鱼AI智能体已覆盖1020万用户。其中,核心产品AI智能发布每天已有超20万人使用,在经过多轮模型优化后,用户采纳率...
02-20
据中国铁路公众号消息,2025年铁路春运1月14日开始,至2月22日结束,为期40天,全国铁路预计发送旅客5.1亿人次,日均发送1275万人次,节前客...
02-08
王兴:预测未来最好的办法是创造它。1.美团高管开会,王兴瞄准三大方向最近,本地生活市场异常火热。群雄逐鹿之下,美团似乎也有些坐不住了。据晚点LatePost独家消息,2月底,美团CEO王...
03-09
2025年,卖奶茶的拼命IPO。作者 | 萧风来源 | 投资家(ID:touzijias)2025年,卖奶茶的拼命IPO。投资家网获悉,号称“每天一杯喝不腻”的新式茶饮公司古茗已通过港交所聆讯、更新招股...
01-22
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
V社发布了2025年1月Steam硬件调查,最流行的配置如下: 显卡 RTX 3060依旧是最流行的显卡,占比5.2%,但份额比上个月(2024年12月)的6.02%下降了0.82个百分点。其次是...
02-04
《天国:拯救2》已正式发售,首发24小时销量就突破100万份。许多玩家对这款中世纪RPG表现出浓厚兴趣。游戏中有许多细节非常真实,比如玩家会因为偷窃被捕,越狱时被守...
02-06
总台记者当地时间2月5日获悉,当天,日本埼玉县八潮市道路塌陷事故现场,救援人员使用水下无人机在下水管道内进行调查时,在塌陷现场下游100米至200米左右的下水管道中,发现了疑似货...
02-06
2月8日,抖音发布《抖音关于打击无底线博流量行为的公告》,对“张兰·俏生活”、“张兰之箖玥甄选”、“汪小菲”等账号予以无限期封禁。公告称,近期,徐熙媛(大S)女士逝世引发广泛...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮