当AI一本正经地胡说八道……

1年前 来源:光明日报 观看:110

【科学随笔·我见AI】TAb即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。TAb即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。TAb即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。TAb即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。TAb即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。TAb即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。TAb即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。TAb即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。TAb即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。TAb即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。TAb即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)TAb即热新闻——关注每天科技社会生活新变化gihot.com

【科学随笔·我见AI】TAb即热新闻——关注每天科技社会生活新变化gihot.com

最近,四岁的女儿向我“汇报”幼儿园生活时,绘声绘色地描述她与一只霸王龙交朋友的故事:她们一起抓小恐龙,因为跷跷板闹翻,又交换零食和好……逻辑严密,细节丰富——尽管她的幼儿园里连只仓鼠都没有。细究之下才知,这孩子原来把绘本、动画和现实糅合在一起,用童言童语编织出一个“合理”的故事。TAb即热新闻——关注每天科技社会生活新变化gihot.com

此情此景,也让我想到当下人工智能(AI)的“幻觉”现象:它能将虚构与真实无缝拼接,生成看似严谨实则荒诞的答案,仿佛一个捧着百科全书满嘴跑火车的天才儿童。TAb即热新闻——关注每天科技社会生活新变化gihot.com

从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑生活。它既能帮中学生秒解几何题,也能替小说家生成缠绵的剧情。而若抛出一些不着边际的问题,譬如“从化学视角解析孙悟空火眼金睛是怎样炼成的”,它也能像模像样地编造出一大篇学术分析,甚至煞有介事地标注出参考文献。更令人啼笑皆非的是,当遭到质疑时,它会杜撰更多论据来自圆其说。这种真假难辨的“知识幻觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,类似的“幻觉”还在被大批量生产出来。TAb即热新闻——关注每天科技社会生活新变化gihot.com

要理解AI为何谎话连篇,得从它的学习方式说起。今天的AI普遍基于大语言模型(LLM)。在它问世之前,传统AI就像循规蹈矩的优等生,全靠死记硬背语法规则来答题解疑;而大语言模型更像炼丹术士,将庞大的语料放入“丹鼎”以期炼得“金丹”。哲学家维特根斯坦曾说,语言的意义不在预设的本质中,而在于日常的使用——就像孩子学说话,没人教“主谓宾”,全靠观察大人如何在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“语言游戏”。大语言模型正是对这种游戏的算法化:它被抛入一个虚拟的语料世界中,吞下海量的文本材料,没有人告诉它该怎么出去,它只能自己从中摸索出一条道路来。TAb即热新闻——关注每天科技社会生活新变化gihot.com

最终,涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。TAb即热新闻——关注每天科技社会生活新变化gihot.com

人们不吝赞美着AI的横空出世,却也正绞尽脑汁要给胡言乱语的AI“治病”。比如,为了防止AI幻觉泛滥,工程师们加装了“知识导航”(检索增强技术RAG)来引导它查证事实,铺设了“轨道护栏”(提示词约束)以防止答案跑偏,甚至请人类老师当“监考”(人类反馈强化学习RLHF)给胡诌打红叉。但即便如此严加管教,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又调皮的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得佩服其想象的不羁。TAb即热新闻——关注每天科技社会生活新变化gihot.com

但或许问题不止于技术层面:究其本质,语言就是真伪交织的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱,网友们在朋友圈嚷嚷“我有一个朋友”——虚构从未远离我们。AI不过是把这一本质端上了桌面。当它用《红楼梦》的文风改编科普文章,或用学术腔调分析“黛玉倒拔垂杨柳”,我们是该大呼造假之离谱,还是惊叹创新之乖奇?这又让我想起女儿的另一则“杰作”:她把动画片里的冰雪魔法,挪到了小区游乐场上,硬说滑梯的另一头连着艾莎公主的城堡。只不过,孩童的幻想至多令人莞尔,AI的幻觉却可能引发真实的麻烦——可不是所有人都能一眼识破那些“一本正经的胡说八道”。TAb即热新闻——关注每天科技社会生活新变化gihot.com

但话说回来,当前条件下,要完全消除AI幻觉,就像苛求孩子永远不说童话——既不可能,亦无必要。关键是如何给“凌空蹈虚”划定赛道:譬如写小说时,自可天马行空;做学术时,便须脚踏实地。目前的主流解法是给AI装上“场景识别器”:当检测到用户需要严谨答案时,自动调用知识库交叉验证;若遇到创意写作,则无妨放飞自我。而要更进一步,就得考虑如何让AI“活”在更真实的语言游戏实践中了。如今的AI看似满口金句,实则是黑箱里的“书呆子”。倘能走出黑箱,交到“朋友”——比如在虚拟社区充当模拟成员,在学术论坛接受“同行”评议,甚至通过脑机接口感受具身经验——或许它能逐渐领悟:语言不仅是符号的概率游戏,而且是生活形式的一部分。TAb即热新闻——关注每天科技社会生活新变化gihot.com

想象某一天,当AI能“感受”小吃摊主吆喝的肢体语言,或程序员代码错误时的尴尬表情,或许它再不会把火眼金睛说成是二氧化硅的高温玻璃化了。TAb即热新闻——关注每天科技社会生活新变化gihot.com

技术狂飙的时代,人们总渴望用算法解决一切问题。但AI幻觉始终在当头棒喝:对理性正确的追求,和对生活世界的回归,需要建立一种动态平衡。如同孩子总会长大,总会学着区分基本的幻想与现实,在人类的引导下,AI的“成长”终将水到渠成。所以面对AI幻觉,与其杞人忧天,倒不如放手让它游戏,只要能不断进入更丰富的场景,领悟更多样的规则,书呆子也学得会“人情练达”。TAb即热新闻——关注每天科技社会生活新变化gihot.com

(作者:鲁博林,系清华大学科学史系助理教授)TAb即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1922-0.html当AI一本正经地胡说八道……

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京:揭秘“神二十”搭载火箭元器件总装车间

下一篇:人形机器人进厂“打工”记

为你推荐
从空间太阳能发电到破解大脑基因密码,再到由真菌制造的自我修复材料,《欧盟研究与创新》杂志盘点了2025年有望大放异彩的创新技术。这些成果拥有广阔...
01-21
这两天,小红书“霸屏”了,成为网络热议话题。如果还有人不明所以,可以打开小红书App浏览一下,就会发现刷到外国博主的几率非常大,他们还给自己贴上了“T...
01-21
  从1月15日召开的甘肃省文物局局长会议上获悉,2024年甘肃省新增博物馆9家、累计达257家,每9.6...
01-22
  据气象部门监测,预计1月26日至27日我省将有一次强降雪、寒潮、大风天气过程,东部地区有大雪(5~10毫米...
01-23
进入冰雪季,东北三省谁能成为新的“顶流”?它们亮出了不同的数据,各自展示自己的受欢迎程度。比如辽宁,元旦假期接待游客267.2万人次,...
01-21
会议现场 红网时刻新闻1月21日讯(记者陈奥男 刘志雄)今天,2025年全省商务工作会议暨扩消费工作推进会在长沙召开。记者从会上获悉,2025年湖南力争社会消费品零售总额增长5.5%...
01-22
1 月 22 日消息,汽车媒体 ShortsCar 昨日(1 月 21 日)在 Instagram 上发布动态,抓拍到了现代 IONIQ 6 首批 P1 原型车的照片。这款流线型电动轿车改头换面,前脸重新设计,...
01-23
[本站 资讯] 近日,小鹏汽车正式推送了AI天玑XOS 5.5.0版本,该版本的新功能,包含图灵AI智驾、智能泊车与出库、AI充电等实用功能。图灵AI智驾车位到车位(先锋版):双击拨杆可...
01-24
近日,多部新剧陆续推出,其中备受期待的《夜访吸血鬼第二季》也终于与观众见面。该剧上映后引起了广泛讨论,在各大社交平台上成为了热门话题。接下来将对《夜访...
02-20
《余烬之上》警察有卧底吗?警局卧底是谁?在《余烬之上》中,警察队伍里有卧底,局长就是其中之一。隐瞒证据:男主廖知白找到好兄弟朗森被杀害的铁证,局长一句“监控...
02-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向2025年版流感诊疗方案发布1月22日,国家卫生健...
01-24
21世纪经济报道记者 林昀肖 北京报道 春节假期过后,72家A股中药上市企业中已有30家企业发布2024年年报业绩预告。据Wind数据,这30家中药上...
02-07
  大众网记者 王一刚 报道  为进一步贯彻落实济南高新区教育文体部“三美”教师师德专题培训内容,加强师德师风建设,提升教师队伍素质,济南高新区玺悦幼教集团(玺悦园、...
01-21
作者:张宝歌(宁波大学教师教育学院院长、东海研究院教授)近年来,学生评教制度已逐步成为各高校提升课堂教学...
01-22
   当地时间1月24日(周五),美股三大指数收跌,道指跌0.32%,标普500指数跌0.29%,纳指跌0.5%。美国1月...
01-27
  原标题:又见共管保险箱被撬!浙金信托一产品爆雷后被监管认定存在四大问题  来源:界面新闻 ...
01-28
狮子座的男生通常自信、热情和有领导力,因此要打动他们的心并不容易。然而,只要你掌握了...
01-22
天蝎座的男生通常被认为是神秘、独立、有魅力的人。他们深思熟虑,善于隐藏自己的情感,并...
01-22
童装新款上市文案? 夏天新款童装文案?一、童装新款上市文案?1、美丽不打折,春款童装全部上新,时光不老,我们不散,繁华落尽,我们一起享受世间美衣,衣服千千万,唯有新款最好看。2、夏装...
02-07
秋季时尚新宠:香奈儿双色鞋的魅力与搭配秘籍在这个秋天,香奈儿再次给我们带来了惊喜。双色鞋的设计不仅让人眼前一亮,更是成为了时尚界的一种潮流趋势。作为一名爱好时尚的编辑...
02-12
2月7日消息,中国商业联合会今日发布2月份中国零售业景气指数(CRPI)。2月份,中国零售业景气指数(CRPI)为50.1%,环比下降1.0个百分点。分析认为,今年春节的大宗年货消费集中在1月份,CRP...
02-07
2月18日消息,春节复工以来,焦点科技旗下中国制造网(以下简称“MIC国际站”)商机同比(按农历年同比)大涨49%,显示出中国外贸的强劲增长动力。平台数据显示,欧洲、大洋洲和南美洲市场...
02-18
2月10日消息,滴滴出行近日宣布携手华住集团会员俱乐部“华住会”,推出联名会员,双方在既有会员权益基础上新增联名会员权益合作,为用户的出行、住宿提供多重优惠与专享体验,方便...
02-11
图片来源:图虫创意 2月20日,《酌见》栏目发布了董明珠与俞...
02-21
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
【#小米汽车登记智能屏界面设计作品著作权#】天眼查App显示,近日,小米汽车科技有限公司登记“智能屏界面设计”作品著作权,作品类别为类似摄制电影方法创作的作品。该公司成立...
02-09
1月27日消息,RTX 50系列即将上市开卖,RTX 5090/5090D的评测已经出炉,但奇怪的是,这次全球媒体评测的样卡,没有一块和FE公版价格相同的标准版,也就是俗称的“丐版”。...
01-29
世嘉在最新财报中详细分析了第三季度的表现,称其娱乐内容业务在销售额和利润同比均增长后依然“强劲”。 具体来看消费者子部门(世嘉娱乐内容部门的电子游戏业...
02-10
据环球时报援引日本《产经新闻》2日报道,自2024年12月下旬流感病例数创新高后,日本多地药店表示已无用于治疗感冒、发烧等疾病药品的库存。此外,一些过于拥挤的医院也建议患者...
02-04
中央气象台今早6点继续发布大风黄色预警和寒潮蓝色预警。大风黄色预警:预计今天8点到明天8点,华北、内蒙古中部、宁夏、陕西北部、黄淮等地的部分地区有5~6级、阵风7~8级的偏...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮