当AI一本正经地胡说八道……

7个月前 来源:光明日报 观看:66

【科学随笔·我见AI】dYL即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。dYL即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。dYL即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。dYL即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。dYL即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。dYL即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。dYL即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。dYL即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。dYL即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。dYL即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。dYL即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)dYL即热新闻——关注每天科技社会生活新变化gihot.com

【科学随笔·我见AI】dYL即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。dYL即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。dYL即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。dYL即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。dYL即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。dYL即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。dYL即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。dYL即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。dYL即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。dYL即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。dYL即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)dYL即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1922-0.html当AI一本正经地胡说八道……

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京:揭秘“神二十”搭载火箭元器件总装车间

下一篇:人形机器人进厂“打工”记

为你推荐
从“神一”到“神十九”,25年间,中国航天带给世界无数次惊喜,人们对航天员在轨期间的工作、生活情况等也越来越关注。未来,随着我国载人航天工程、载人...
01-21
持续跳动的“心脏”、有代谢功能的“肝脏”、会呼吸的“肺”……在巴掌大小的芯片上,先“盖”出模拟人体环境的“房子”,再向其中引入相...
01-24
  春节假期临近,宠物寄养成为宠物主关注焦点。  记者12日走访上海多家宠物店发现,近期宠物寄...
01-21
  近日,《辽宁省沿海港口布局规划(2024—2035年)》(以下简称《规划》)正式出台。我省是2023年全国港口航道...
02-05
图源:图虫创意 第二个5000亿县级市诞生了。1月6日,江阴市第...
01-21
  国内首个男性HPV疫苗上市,如何搅动百亿市场?国产疫苗有哪些布局?  男性也可以接种HPV疫苗了。  1月18日,默沙东在北京、上海、广州同时举行新闻发布会,宣布四价HPV(人乳...
01-21
1 月 24 日消息,截至 2024 年 12 月 30 日,理想超充站上线超过 1600 站,其中高速理想超充站 714 座、理想城市超充站 895 座。然而,这距离年初公布的2000 站的建站目标...
01-25
2 月 1 日消息,寒冷天气会导致电动汽车续航里程下降,温度越低,单次充电能行驶的距离就越短。温度来到冰点以下之后,电动车的续航损失究竟有多大?据外媒 Carscoops 今日报...
02-02
  胡建礼  系列电影的创作并非易事,绝非简单复制。续集既要保持与前作IP风格和元素的连贯性,...
02-18
电视剧《难哄》中的钟思乔职业成为了近期热门话题。该剧开拍前就吸引了大量粉丝,随着剧集播出,更多观众加入粉丝群体,对剧情充满期待,并对钟思乔的职业感到好奇...
02-22
  冬天适量食用南瓜,不仅能为身体提供丰富的营养,还能为健康加上一道坚实的屏障,南瓜也越来越成为受到人们喜爱的主食之一。南瓜...
01-21
  本报北京1月13日电 (记者孙秀艳)为进一步加大对创新药的支持力度,国家医保局将研究出台一系列更有力度的政策举措。  国家医保局近日召开支持创新药发展企业座谈...
01-21
    葛墨林在为本科生上课。南开大学供图  人物小传  葛墨林,1938年出生于北京,中国科学...
01-21
  大众网记者 张明明 报道  7月27日至31日,由教育部高等教育司指导、中国高等教育学会主办的第四届全国高校教师教学创新大赛在成都举行,校(院)临床与基础医学院(基础医学...
01-21
  摘要  【骤增近30%纯碱库存创历史新高!供需失衡态势加剧?】本周,纯碱市场呈现双弱状态。纯碱...
02-07
  中国网财经2月8日讯 日前,国家金融监督管理总局上海监管局核准高建辉中海信托股份有限公司总...
02-11
在星座中,双鱼男被认为是最温柔、体贴的一位。他们对待爱情充满了浪漫和梦幻色彩,总是能...
01-22
水瓶座男生以其独特的思维方式和开放的个性而闻名。他们喜欢追求自由和创新,对于传统观...
01-22
布鲁克鸟男士服饰品牌?布鲁克鸟男士服饰品牌?作为一名有品位的中年男性,一定听说过布鲁克鸟男装。相比外国品牌,布鲁克鸟作为中国本体时装品牌,旗下的服装以中国人体型为标准打造...
02-07
小小模特的魅力:少儿泳装T台秀的精彩瞬间当阳光洒下,波光粼粼的泳池边,无疑是一次充满活力的少儿泳装T台走秀的最佳场域。想象一下,小朋友们穿着色彩斑斓的泳装,自信地走上T台,仿...
02-17
2月11日消息,百果园近日在深圳举办了一场“蒲江耙耙柑好果报恩新季上市”快闪活动,百果园集团创始人兼董事长余惠勇、百果园集团零售事业群副总裁兼零售事业群商品中心总经理...
02-11
2月15日消息,淘宝发布“情人节送礼榜”,护肤品、化妆品稳坐情人节礼物前排,淘宝天猫上的护肤类产品、唇部彩妆订单分别增长了124%、144%。口红、眼影、粉底液的“色号难题”,几...
02-16
2月12日消息,美团旅行数据显示,2月第一周,“元宵灯会”搜索量同比上涨351%,“元宵灯谜”搜索量同比上涨超225%。2025年元宵十大热门灯会分别是:唐山南湖春节灯会、自贡国际恐龙灯...
02-13
3月2日消息,据北京商报,京东物流旗下生活服务平台“京东服务+”小程序上线了“京东搬家”频道入口,提供“京尊搬”“京享搬”两类搬家服务,服务人员均为京东物流全职自营员工。...
03-03
2月5日,有投资者在投资者互动平台向东峰集团提问:公司公告预计亏损5亿元左右,感觉公司今年在洗澡。国资入主后是否会调整并购策略?未来准备如何提升公司经营业绩?东峰集团在投资...
02-09
在全球经贸环境遭遇寒流,多国贸易活动陷入低迷之际,中国外贸犹如一艘巨轮,破浪前行,展现出非凡的韧性和增长潜力。作为世界第二大经济体,中国外贸不仅是国内经济增长的重要支柱,更...
02-09
Apogee Entertainment已将《Turbo Overkill》中充满爆炸场面的动作元素和链锯带来的混乱体验带到了Xbox Series X/S平台。这款残酷的赛博朋克风格第一人称射击...
02-03
玩家们经常将《漫威争锋》与《守望先锋2》相比较,多数人认为《漫威争锋》比《守望先锋2》更有趣好玩。《漫威争锋》上线后,其Steam玩家数不断攀升,而《守望先锋2...
02-03
你的浏览器不支持video标签。极目新闻记者 张屏 视频剪辑 李仪2月5日,10位“楚才”人形机器人在武汉洪山礼堂组团亮相,为湖北省“新春第一会”上演科技序曲。其中,华中科技大学...
02-05
营造清朗涉军网络舆论环境——解读《互联网军事信息传播管理办法》的四大特点《互联网军事信息传播管理办法》(以下简称《办法》),以习近平新时代中国特色社会主义思想为指导,全...
02-10
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮