当AI一本正经地胡说八道……

9个月前 来源:光明日报 观看:71

【科学随笔·我见AI】vgE即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。vgE即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。vgE即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。vgE即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。vgE即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。vgE即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。vgE即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。vgE即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。vgE即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。vgE即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。vgE即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)vgE即热新闻——关注每天科技社会生活新变化gihot.com

【科学随笔·我见AI】vgE即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。vgE即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。vgE即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。vgE即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。vgE即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。vgE即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。vgE即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。vgE即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。vgE即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。vgE即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。vgE即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)vgE即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1922-0.html当AI一本正经地胡说八道……

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京:揭秘“神二十”搭载火箭元器件总装车间

下一篇:人形机器人进厂“打工”记

为你推荐
近日,B站一名员工滥用权限,让某用户在使用哔哩哔哩弹幕网(俗称B站)网页端观看视频时,被错误提示“账号已被封禁”,引发广泛关注。1月21...
01-21
  今天(2月6日),蛇年首场寒潮上线,将自北向南给中东部地区带来大风降温天气,西北地区东部、华北和...
02-06
  2月14日,全新BMW X3长轴距版上市,全新BMW X3首次加长轴距,带来更宽适空间、更智能交互和更高级驾乘质...
02-15
新闻记者 兰莎通讯员 陈强 吴佳倩2025年1月20日,备受瞩目的《手机、平板、智能手表(手环)购新补贴实施方案》手机国家补贴政策正式落地,不少湖北市民走进当地通信运营商营业厅挑...
01-21
  中新经纬1月20日电 “最高人民检察院”微信号20日消息,中国电子科技集团有限公司原党组成员、副总经理何文忠涉嫌受贿一案,由国家监察委员会调查终结,经最高人民检察院指定...
01-21
1 月 29 日消息,宝马公司推出了 2026 款 iX 中型 SUV,作为中期改款车型,此次改款不仅对车型阵容进行了调整,还对外观、内饰以及动力系统进行了优化升级。宝马 iX 自 202...
01-29
2月4日,赛力斯发布2025年1月产销快报。数据显示,赛力斯新能源汽车1月销量达17906辆。问界M9系列1月交付12483辆,连续10个月蝉联中国豪华市场50万元以上豪华车销量第一,持续引领...
02-05
随着电视剧《难哄》的热播,段嘉许这一角色的首次亮相引起了广泛关注。该剧凭借精彩的剧情、精良的制作和精湛的演技,赢得了观众的一致好评,并取得了收视率第一...
02-20
  1、《难哄》钟思乔一开始喜欢的人是向朗,后来喜欢上了苏浩安,和苏浩安走到了一起。  2、钟思乔和向朗、温以凡是青梅竹马,在不知道向朗喜欢温以凡之前,钟思乔一直暗恋向...
02-22
  女性天生拥有两条X染色体,一条遗传自母亲,一条遗传自父亲。不过,为了确保基因表达的平衡,女性体...
01-27
  美国宾夕法尼亚大学科学家绘制出了迄今最完整、最详细的肾功能遗传图谱,发现1000多个基因有...
02-14
  大众网记者 司心鹏 报道  在12月13日至16日举办的第十七届山东省职业院校技能大赛(高职组)体育活动设计与实施赛项中,菏泽医学专科学校公共教学部体育教研室指导的参...
01-21
2024年12月全国计算机应用水平考试将于12月14至16日举行,报名时间为11月15日9时至19日18时。我省考点全...
01-21
  唐山银行股份有限公司(下称“唐山银行”)股权再次流拍。  近日,登记在唐山玉龙房地产开发有...
01-22
  “春节后,豆粕一天一个价,今天就涨了300元(每吨)。”提及近期豆粕价格情况,广东一家中型饲料企业...
02-13
星座配对一直是人们关注的话题,其中双子座男和处女座女的组合备受瞩目。他们之间的配对...
01-22
天秤男是一个追求平衡和和谐的星座,他们善于处理人际关系,注重公正和公平。然而,在与天秤...
01-22
当红女星,惊艳绽放的魅力之路在娱乐圈,亮眼的明星总是让人心生向往,而那些令人惊艳的女明星更是层出不穷。她们的美丽、才华,以及独特的个人风格,使她们在不断变化的时尚潮流中脱...
02-07
穿貂怎么搭配围巾图片欣赏?一、穿貂怎么搭配围巾图片欣赏?个人觉得貂皮本身就有厚重感,搭配围巾不是很适合,可以搭配轻质的丝巾。搭配如果艳丽一点可以选择正红色;肤色白的话可以...
02-17
2月11日消息,为加力推进农村电商、乡村旅游等乡村产业发展壮大,近日,农业农村部指导抖音等网络平台,开展“星乡村”“星农人”培育工作,以公益方式扶持培育一批有特色有潜力的乡...
02-11
已经闹上法庭。1、三只羊公司被起诉过去了这么久,没等到小杨哥复出,却等来了三只羊的官司。近日,据天眼查消息,合肥三只羊网络科技有限公司、广州市美诚食品有限公司等新增一则...
02-13
2月13日消息,京东养车日前与杭州陆益嘉信息技术有限公司达成战略合作,双方将以独家授权的合作模式,共同推进浙江省五市京东养车连锁加盟门店的拓展。根据合作协议,双方将于三年...
02-14
2月19日消息,药师帮日前发布2024年正面盈利预告。根据对公司报告期内未经审计综合财务数据的初步审阅,药师帮预计2024年全年归属于股东净利润不低于人民币2,000万元,与上年同期...
02-20
在新能源汽车赛道进入淘汰赛之际,一家新锐公司正异军突起。12月18日消息,醇氢科技宣布完成1.35亿美元的Pre-A+轮融资,引入多家战略投资者,投后估值超1...
02-07
【#深圳大学等成立垂直起降飞行器创新中心公司# 注册资本1亿】天眼查App显示,近日,深圳垂直起降飞行器创新中心有限公司成立,法定代表人为杨军,注册资本1亿人民币,经营范围包括工...
02-09
在《GTA5》中为魅力主角之一崔佛配音的男演员史蒂文·奥格(Steven Ogg)希望能在《GTA6》中最后一次扮演这个疯子角色。史蒂文·奥格希望崔佛能在游戏早期的某个...
01-29
最近我第一次亲眼看到了 Steam Deck,才意识到这款掌上电脑实际上有多大。当初我已经觉得 PS Vita 的体积和重量不方便携带,SteamDeck对于随时随地有玩游戏来说可...
01-29
问:美国东部时间2月1日,美方宣布对中国输美产品加征10%关税。中方对此有何评论?答:美方以芬太尼问题为由,对中国输美产品加征10%关税,中方对此强烈不满,坚决反对,将采取必要反制措施...
02-02
△以色列外交部长萨尔(资料图)以色列外交部长萨尔5日说,以色列将不参加联合国人权理事会。萨尔当天在社交媒体上说,以色列欢迎美国总统特朗普关于美国退出联合国人权理事会的决...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮