当AI一本正经地胡说八道……

1个月前 来源:光明日报 观看:21

【科学随笔·我见AI】xwe即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。xwe即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。xwe即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。xwe即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。xwe即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。xwe即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。xwe即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。xwe即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。xwe即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。xwe即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。xwe即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)xwe即热新闻——关注每天科技社会生活新变化gihot.com

【科学随笔·我见AI】xwe即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。xwe即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。xwe即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。xwe即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。xwe即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。xwe即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。xwe即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。xwe即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。xwe即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。xwe即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。xwe即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)xwe即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1922-0.html当AI一本正经地胡说八道……

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京:揭秘“神二十”搭载火箭元器件总装车间

下一篇:人形机器人进厂“打工”记

为你推荐
被誉为“AI六小虎”之一北京智谱华章科技有限公司(以下简称智谱)被拉入实体清单了。当地时间1月15日,美国商务部工业和安全局(BIS)修订...
01-21
1月15日,记者从中国科学院大连化学物理研究所获悉,该所动力电池与系统研究中心主任陈忠伟团队与双登集团近日对外联合发布了最新一代智能电池管理系...
01-21
  1月14日,2025年除夕火车票正式开售。  2025年春节从1月28日(除夕)开始,至2月4日(正月初七)...
01-21
  ◎刘侠本报记者滕继濮  2月4日,正值新春假期。四川自贡的夜空,被一盏盏精美绝伦的彩灯点缀...
02-11
  NFC是近场通信的简称,它是一种短距离的无线通信技术,能让电子设备在靠得很近的时候进行数据交换,这个距离一般在几厘米之内。  刷公交卡、移动支付、电子门禁……日常...
01-21
  低空运动设备发生事故?海南陵水:非旅游行为 当事人无碍  中新网海南陵水1月20日电 (张月和)1月18日,网传海南陵水清水湾有疑似滑翔伞等运动游乐设备发生安全事故。海南省...
01-21
  21世纪经济报记者巩兆恩广州报道  “未来5年,锂电产业市场将迎来井喷期,快速进入到TWh时代...
01-23
1 月 24 日消息,截至 2024 年 12 月 30 日,理想超充站上线超过 1600 站,其中高速理想超充站 714 座、理想城市超充站 895 座。然而,这距离年初公布的2000 站的建站目标...
01-25
SQL Error: select * from ***_ecms_news5 where id in(,25) limit 2
21世纪经济报道记者李佳英、季媛媛 广州、上海报道 细胞疗法,作为新一代精准医疗技术的典范,正在推动全球生物制药行业的最新一轮发展和变革...
01-25
  美国科罗拉多大学博尔德分校一项最新研究表明,与较早经历更年期的女性相比,较晚经历更年期的...
02-11
  大众网记者 隋宜笑 报道  为培养适应新时代需求的全媒体新闻人才搭建更为广阔、坚实的平台,进一步深化校企合作,12 月 17 日,山东传媒职业学院新闻传播系于产教中心报...
01-21
  2025年1月14日,西安市职业教育与成人教育协会2024年度工作总结大会成功召开。来自省、市职业教育界的专家、领导及协会各成员校的负责人共同回顾和展望西安职业教育的发...
01-21
  近日,中央金融办、中国证监会、财政部、人力资源和社会保障部、中国人民银行、金融监管总局...
01-24
  财联社1月26日讯(记者 邹俊涛)宜宾银行(2596.HK)近3.52%股权流拍,超千次围观却无人出价。  1月...
01-28
白羊座女生是十二星座中最有活力和冲劲的一类人。她们充满了热情和自信,总是充满了无限...
01-22
水瓶座的男人通常具有独立、聪明、理性和创新的特点。他们对于自由和个人空间非常重视...
01-22
探索幻走服饰:蕴含个性与时尚的潮流选择在瞬息万变的时尚潮流中,服饰不仅是对外形象的展示,更是个性化风格的体现。今天,我想和大家聊一聊一个备受关注的服饰品牌――幻走服饰。...
02-07
探索巴尔虎蒙古族的独特服饰文化在中国的辽阔大地上,生活着许多各具特色的民族,其中巴尔虎蒙古族以其独特的服饰文化而闻名。每当我看到他们的传统服饰,不禁想深入了解这其中的...
02-12
2月5日消息,苏宁易购发布的春节消费大数据显示:春节期间,本地以旧换新消费需求进一步扩大,苏宁易购门店迎来销售“小高峰”,全国门店客流同比提升80%,以旧换新订单量同比增长92%。...
02-07
2月11日消息,中国B2B外贸金融平台XTransfer近日与非洲最大的跨国银行之一Ecobank签署合作谅解备忘录 ,双方将携手为非洲中小微贸易企业提供优质的跨境金融及风控服务,进一步促...
02-11
2月28日消息,蚂蚁集团发布内部通知,宣布对两项薪酬政策进行调整,以提升员工薪酬收入的流动性和激励即时性。根据通知:17级及以下员工取消年底13薪,改为并入到每月基本工资中发放;1...
03-01
3月2日消息,银联-Visa“北京中轴线无障碍支付服务旅游示范区”启动仪式日前在北京坊举行。北京市文化和旅游局将携手中国银联与Visa,合作共建银联-Visa“北京中轴线无障碍支付...
03-03
2025年1月21日中金公司发布了“全球Robotaxi第一股”文远知行的调研报告,这一报告引起了媒体的广泛关注。中金公司在财报中指出文远知行有着三大显著特点:1、自动驾驶行业的先...
01-23
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
玩家们经常将《漫威争锋》与《守望先锋2》相比较,多数人认为《漫威争锋》比《守望先锋2》更有趣好玩。《漫威争锋》上线后,其Steam玩家数不断攀升,而《守望先锋2...
02-03
华纳兄弟游戏近日宣布,旗下推出不久的实时服务大乱斗格斗游戏《华纳大乱斗》即将在最后一个赛季,第五赛季之后关服。虽然在这之后仍然可以离线游玩,但游戏的网络...
02-04
据央视新闻报道,当地时间2月1日,美国联邦选举委员会年底的备案文件显示,埃隆·马斯克在2024年美国大选中的花费超过了2.9亿美元。马斯克 资料图(来源:环球网)文件表明,马斯克在年末...
02-02
2月9日是哈尔滨亚冬会开幕后的第二个比赛日,中国代表团以15金15银14铜继续领跑奖牌榜。在滑雪登山女子短距离、滑雪登山男子短距离、越野滑雪女子5公里(自由技术)、自由式滑雪...
02-10
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮