ChatGPT如何“思考”——科学家竞相破解大型语言模型背后的谜团

7个月前 来源:中国科技网 观看:51

北京时间5月14日凌晨,美国开放人工智能研究中心(OpenAI)发布了其下一代大型语言模型GPT-4o,人工智能(AI)领域再起硝烟。NHr即热新闻——关注每天科技社会生活新变化gihot.com

尽管AI一词已很普及,但其内部运作方式仍像黑箱操作一样,是一个谜。因为AI依赖机器学习算法,而先进的机器学习算法使用模拟人脑结构的神经网络,信息在不同神经元间传递,以人类不易理解的方式内化数据,缺乏可视化和透明度。NHr即热新闻——关注每天科技社会生活新变化gihot.com

这个问题对ChatGPT等大型语言模型(LLM)来说尤其严重,部分原因在于它们规模庞大,有些LLM拥有数千亿甚至上万亿个参数。NHr即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在15日的报道中指出,为洞悉LLM的黑箱操作,科学家正对AI系统进行逆向工程。他们扫描LLM的“大脑”,以揭示它们在做什么、如何做以及为什么这样做等谜团。NHr即热新闻——关注每天科技社会生活新变化gihot.com

谈话疗法NHr即热新闻——关注每天科技社会生活新变化gihot.com

由于聊天机器人可以进行对话,一些研究人员就让模型自我解释,以了解其工作原理。这种方法类似于心理学中使用的“谈话疗法”。NHr即热新闻——关注每天科技社会生活新变化gihot.com

德国斯图加特大学计算机科学家蒂洛·哈根德夫表示,人脑和LLM都像是一个“黑箱”,而心理学有能力研究它。NHr即热新闻——关注每天科技社会生活新变化gihot.com

去年,哈根德夫发表了一篇关于“机器心理学”的文章。他认为,通过将LLM视为人类主体,让其参与对话,可以阐明其复杂行为。NHr即热新闻——关注每天科技社会生活新变化gihot.com

面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。NHr即热新闻——关注每天科技社会生活新变化gihot.com

简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给出输入—输出,思维链提示还会额外增加推理过程。NHr即热新闻——关注每天科技社会生活新变化gihot.com

该方法在GPT-3等三个大型语言模型上都得到了验证:对比标准提示,新方法在一系列算术推理任务上的准确率都有了显著提高。但美国纽约大学研究人员的一项最新研究表明:LLM并没有利用思维链的推理能力,它只是偷偷加了计算。NHr即热新闻——关注每天科技社会生活新变化gihot.com

美国东北大学计算机科学家戴维·鲍表示,尽管以研究人类的方式研究LLM有点奇怪,但两者的行为却以令人惊讶的方式重叠。在过去两年里,许多科学家将用于人类的问卷和实验应用于LLM,测量了其人格、推理、偏见、道德价值观、创造力、情绪、服从性等。结果显示,在许多情况下,机器能复制人类行为。但在有些情况下,它们的行为与人类行为不一样。例如,LLM比人类更容易受到暗示,其行为也会随着问题措辞的不同而发生巨大变化。NHr即热新闻——关注每天科技社会生活新变化gihot.com

脑部扫描NHr即热新闻——关注每天科技社会生活新变化gihot.com

一些科学家从神经科学领域汲取技巧,以此来探索LLM的内部工作原理。NHr即热新闻——关注每天科技社会生活新变化gihot.com

为研究聊天机器人是如何进行欺骗的,美国卡内基梅隆大学计算机专家安迪·邹及其合作者询问了LLM,并观察了它们神经元的激活情况。邹指出,这有点像对人类进行脑部神经成像扫描,也有点像使用测谎仪。NHr即热新闻——关注每天科技社会生活新变化gihot.com

研究人员多次让LLM撒谎或说实话,并测量了神经元活动模式的差异。然后,每当向模型提出一个新问题时,他们都可以观察其活动,并判断答案是否真实。在一个简单任务中,该方法的准确率超过90%。邹表示,此类系统可以实时检测出LLM不诚实行为。NHr即热新闻——关注每天科技社会生活新变化gihot.com

鲍及其同事则开发了扫描和编辑人工智能神经网络的方法,包括一种他们称之为因果追踪的技术,以确定AI“大脑”中以特定方式回答问题的部分。NHr即热新闻——关注每天科技社会生活新变化gihot.com

鲍指出,人工神经网络的好处在于,可以在它们身上做神经科学家梦寐以求的实验,比如可以观察每一个神经元、运行数百万次网络、进行各种疯狂的测量和干预,且做这些都不必获得同意书。NHr即热新闻——关注每天科技社会生活新变化gihot.com

打破不可解释性NHr即热新闻——关注每天科技社会生活新变化gihot.com

邹和鲍等人提出LLM扫描技术采用自上而下的方法,将概念或事实归因于潜在的神经表征。还有一些科学家则使用自下而上的方法,即观察神经元并询问它们代表什么。NHr即热新闻——关注每天科技社会生活新变化gihot.com

神经元的不可解释性,一直是AI领域的“老大难”问题。2023年,来自Anthropic公司的一个团队提出了一种方法,成功将512个神经元分解成了4096个可解释特征,从而让其具有了可解释性。NHr即热新闻——关注每天科技社会生活新变化gihot.com

研究人员表示,他们这一方法很有可能克服AI不可解释性这一巨大障碍。一旦人类了解LLM工作原理,就能很容易地判断其是否安全,从而决定它是否应该被社会和企业采用。NHr即热新闻——关注每天科技社会生活新变化gihot.com

不过,邹表示,尽管这种方法很有价值,但不太适合解释更复杂的AI行为。NHr即热新闻——关注每天科技社会生活新变化gihot.com

尽管研究人员仍在努力弄清楚AI如何工作,但人们越来越达成一致意见:AI公司应该努力为其模型提供解释,政府也应该制定相关法规来执行这一点。NHr即热新闻——关注每天科技社会生活新变化gihot.com

北京时间5月14日凌晨,美国开放人工智能研究中心(OpenAI)发布了其下一代大型语言模型GPT-4o,人工智能(AI)领域再起硝烟。NHr即热新闻——关注每天科技社会生活新变化gihot.com

尽管AI一词已很普及,但其内部运作方式仍像黑箱操作一样,是一个谜。因为AI依赖机器学习算法,而先进的机器学习算法使用模拟人脑结构的神经网络,信息在不同神经元间传递,以人类不易理解的方式内化数据,缺乏可视化和透明度。NHr即热新闻——关注每天科技社会生活新变化gihot.com

这个问题对ChatGPT等大型语言模型(LLM)来说尤其严重,部分原因在于它们规模庞大,有些LLM拥有数千亿甚至上万亿个参数。NHr即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在15日的报道中指出,为洞悉LLM的黑箱操作,科学家正对AI系统进行逆向工程。他们扫描LLM的“大脑”,以揭示它们在做什么、如何做以及为什么这样做等谜团。NHr即热新闻——关注每天科技社会生活新变化gihot.com

谈话疗法NHr即热新闻——关注每天科技社会生活新变化gihot.com

由于聊天机器人可以进行对话,一些研究人员就让模型自我解释,以了解其工作原理。这种方法类似于心理学中使用的“谈话疗法”。NHr即热新闻——关注每天科技社会生活新变化gihot.com

德国斯图加特大学计算机科学家蒂洛·哈根德夫表示,人脑和LLM都像是一个“黑箱”,而心理学有能力研究它。NHr即热新闻——关注每天科技社会生活新变化gihot.com

去年,哈根德夫发表了一篇关于“机器心理学”的文章。他认为,通过将LLM视为人类主体,让其参与对话,可以阐明其复杂行为。NHr即热新闻——关注每天科技社会生活新变化gihot.com

面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。NHr即热新闻——关注每天科技社会生活新变化gihot.com

简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给出输入—输出,思维链提示还会额外增加推理过程。NHr即热新闻——关注每天科技社会生活新变化gihot.com

该方法在GPT-3等三个大型语言模型上都得到了验证:对比标准提示,新方法在一系列算术推理任务上的准确率都有了显著提高。但美国纽约大学研究人员的一项最新研究表明:LLM并没有利用思维链的推理能力,它只是偷偷加了计算。NHr即热新闻——关注每天科技社会生活新变化gihot.com

美国东北大学计算机科学家戴维·鲍表示,尽管以研究人类的方式研究LLM有点奇怪,但两者的行为却以令人惊讶的方式重叠。在过去两年里,许多科学家将用于人类的问卷和实验应用于LLM,测量了其人格、推理、偏见、道德价值观、创造力、情绪、服从性等。结果显示,在许多情况下,机器能复制人类行为。但在有些情况下,它们的行为与人类行为不一样。例如,LLM比人类更容易受到暗示,其行为也会随着问题措辞的不同而发生巨大变化。NHr即热新闻——关注每天科技社会生活新变化gihot.com

脑部扫描NHr即热新闻——关注每天科技社会生活新变化gihot.com

一些科学家从神经科学领域汲取技巧,以此来探索LLM的内部工作原理。NHr即热新闻——关注每天科技社会生活新变化gihot.com

为研究聊天机器人是如何进行欺骗的,美国卡内基梅隆大学计算机专家安迪·邹及其合作者询问了LLM,并观察了它们神经元的激活情况。邹指出,这有点像对人类进行脑部神经成像扫描,也有点像使用测谎仪。NHr即热新闻——关注每天科技社会生活新变化gihot.com

研究人员多次让LLM撒谎或说实话,并测量了神经元活动模式的差异。然后,每当向模型提出一个新问题时,他们都可以观察其活动,并判断答案是否真实。在一个简单任务中,该方法的准确率超过90%。邹表示,此类系统可以实时检测出LLM不诚实行为。NHr即热新闻——关注每天科技社会生活新变化gihot.com

鲍及其同事则开发了扫描和编辑人工智能神经网络的方法,包括一种他们称之为因果追踪的技术,以确定AI“大脑”中以特定方式回答问题的部分。NHr即热新闻——关注每天科技社会生活新变化gihot.com

鲍指出,人工神经网络的好处在于,可以在它们身上做神经科学家梦寐以求的实验,比如可以观察每一个神经元、运行数百万次网络、进行各种疯狂的测量和干预,且做这些都不必获得同意书。NHr即热新闻——关注每天科技社会生活新变化gihot.com

打破不可解释性NHr即热新闻——关注每天科技社会生活新变化gihot.com

邹和鲍等人提出LLM扫描技术采用自上而下的方法,将概念或事实归因于潜在的神经表征。还有一些科学家则使用自下而上的方法,即观察神经元并询问它们代表什么。NHr即热新闻——关注每天科技社会生活新变化gihot.com

神经元的不可解释性,一直是AI领域的“老大难”问题。2023年,来自Anthropic公司的一个团队提出了一种方法,成功将512个神经元分解成了4096个可解释特征,从而让其具有了可解释性。NHr即热新闻——关注每天科技社会生活新变化gihot.com

研究人员表示,他们这一方法很有可能克服AI不可解释性这一巨大障碍。一旦人类了解LLM工作原理,就能很容易地判断其是否安全,从而决定它是否应该被社会和企业采用。NHr即热新闻——关注每天科技社会生活新变化gihot.com

不过,邹表示,尽管这种方法很有价值,但不太适合解释更复杂的AI行为。NHr即热新闻——关注每天科技社会生活新变化gihot.com

尽管研究人员仍在努力弄清楚AI如何工作,但人们越来越达成一致意见:AI公司应该努力为其模型提供解释,政府也应该制定相关法规来执行这一点。NHr即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-5075-0.htmlChatGPT如何“思考”——科学家竞相破解大型语言模型背后的谜团

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:青少年与航天员“天地共养”斑马鱼

下一篇:蜥蜴断尾求生带来设计灵感——新型建筑系统能预防整体倒塌

为你推荐
法律:网上平台被黑提款客服说财务清算注单异常不给出款藏分技巧【微信chuhei816】被黑不给取款怎么办,小编来告诉你 在互联网日益发展的今天,网上金融活动已经渗透到我们生活的...
08-05
北京西城区当面套花呗京东白条抖音月付分期乐VISA信用卡分付微电:150 0062 3958 全天当面接单在线欢迎来电,还有分付,分期乐,苹果专享额度都可以办理!白条怎么套出来,大家在急用钱...
08-04
人不知而不愠,不亦君子乎?——《论语》  译:如果我有了某些成就,别人并不理解,可我决不会感到气愤、委屈。这不也是一种君子风度的表现吗? 不以一眚(shěng)掩大德。&...
08-07
重庆风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-07
▲广东白云学院西校区学校正门。图/广东白云学院官网据界面新闻报道,10月21日,广东白云学院发布关于对《广东一高校公示1477名录取新生拟放弃入学?校方回应:可能他们想复读》的...
10-23
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【得物佳物分期购可以提现吗】【得物的分期购额度怎么套出来...
08-17
一键解锁:微信商家怎么收分付的钱(2024最新5个方法可以帮你实现)探索世界万象,普及科学、科技知识!从未见过你,但会更懂你。每天分享各种生活小窍门,一起享受生活。 微信分付上...
09-04
预支-总算发现微信分付支持哪些商家,实操12种方法具体详细步骤随着移动支付的普及和便利性,分付作为微信的支付工具之一,成为人们生活中必不可少的支付方式。为了使用分付进行...
09-04
春季是儿童身体生长发育的好时机,也是消化吸收比较迅速的一段时间,因此,家长可以利用好这个时期,让孩子得到充足的营养,培养孩子良好的生活习惯,令其拥有一个健康有能量的身体。儿...
04-02
立秋的到来,意味着我们终于迎来了凉爽的秋季,由于在夏季我们消耗了太多能量,此时为身体进补不仅是为了能健康地度过秋季,更是为了下一个冬季打下良好的基础。因此不少人在秋季都...
04-02
  大众网记者 刘佳琦 隋宜笑 泰安报道  2024年9月8日,山东医药技师学院迎来了2024级秋季新生,共计超过2000名学生入学。新生们跨越山海,满怀梦想与希望,正式开启了他们新...
09-09
为更好发挥实践育人作用,探索我国数字经济对国民经济高质量发展的赋能效用,大连理工大学马克思主义学院第...
09-05
8年专业老商家微:k973880【8年专注更专业】【靠谱秒到】24小时在线接单我们都知道白条是京东金融旗下的消费信贷产品,功能是给我们消费购物使用,先用后还,这种模式比较适合大部...
08-22
上海风控花呗白条套取秒到账:【181 181 43671微信同号】万事达 、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已...
08-14
合肥风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-23
  新华社巴黎8月3日电(记者许仕豪、周楚昀)在3日进行的巴黎奥运会羽毛球女双决赛中,中国组合陈清晨/贾一...
08-04
  风险偏好下行背景下,高股息策略受到市场青睐。谈及“壕气分红天团”,一定绕不过上市银行。每...
06-27
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮