OpenAI智能体能像人那样使用电脑,向实现通用人工智能迈进一步

5个月前 来源:中国科技网 观看:69

当地时间1月23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使用电脑,从而向实现通用人工智能迈进了一步。njI即热新闻——关注每天科技社会生活新变化gihot.com

演示中,Operator展现了其强大的能力。它不仅能够精确理解指令,还能自主完成复杂任务,如自动填写在线表单、进行网购、创建表情包以及处理重复性浏览器任务等。这一切都是通过一个被称为CUA的新模型实现的。该模型结合了GPT-4o的视觉功能和高级推理技术,并通过强化学习不断优化自己的性能。njI即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,在多个测试环境中,CUA模型的表现令人印象深刻。例如,在OSWORLD上执行计算机使用任务的成功率达到了38.1%,比之前最佳结果提高了近16%;而在WebArena上的成功率更是高达58.1%,提升了22%。尽管这些成绩与人类相比还有一定差距(人类分别为72.4%和78.2%),但CUA在某些特定场景下展示了惊人的效率,比如在网页代理WebVoyager平台上,达到了87%的成功率。njI即热新闻——关注每天科技社会生活新变化gihot.com

为确保安全性和用户体验,当Operator执行任务时,会采取行动、抓取屏幕截图并创建子计划,形成一个“观察—计划—执行”的闭环。此外,用户可以随时接管控制权,并且在接管期间的所有操作都不会被记录下来,以此保护隐私。即使遇到买错东西或订错酒店的情况,Operator也会在继续行动之前请求人类确认。njI即热新闻——关注每天科技社会生活新变化gihot.com

面对可能存在的风险,如诈骗网站,OpenAI引入了一个提示注入监视器,类似于防病毒软件的功能,可以在发现可疑行为时立即停止操作。这标志着L3级别的智能体时代正式到来,而OpenAI也重申了其对2025年的展望——这一年将是智能体之年。njI即热新闻——关注每天科技社会生活新变化gihot.com

随着Operator的发布,未来几个月内,人们或有望见证更多智能体的出现。它们将进一步扩展动作空间,适应更加广泛的应用场景,开启下一轮人机交互革命。目前,Operator仅限于美国的ChatGPT Pro(付费服务)用户试用,不过未来很快会向更多用户提供服务。njI即热新闻——关注每天科技社会生活新变化gihot.com

当地时间1月23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使用电脑,从而向实现通用人工智能迈进了一步。njI即热新闻——关注每天科技社会生活新变化gihot.com

演示中,Operator展现了其强大的能力。它不仅能够精确理解指令,还能自主完成复杂任务,如自动填写在线表单、进行网购、创建表情包以及处理重复性浏览器任务等。这一切都是通过一个被称为CUA的新模型实现的。该模型结合了GPT-4o的视觉功能和高级推理技术,并通过强化学习不断优化自己的性能。njI即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,在多个测试环境中,CUA模型的表现令人印象深刻。例如,在OSWORLD上执行计算机使用任务的成功率达到了38.1%,比之前最佳结果提高了近16%;而在WebArena上的成功率更是高达58.1%,提升了22%。尽管这些成绩与人类相比还有一定差距(人类分别为72.4%和78.2%),但CUA在某些特定场景下展示了惊人的效率,比如在网页代理WebVoyager平台上,达到了87%的成功率。njI即热新闻——关注每天科技社会生活新变化gihot.com

为确保安全性和用户体验,当Operator执行任务时,会采取行动、抓取屏幕截图并创建子计划,形成一个“观察—计划—执行”的闭环。此外,用户可以随时接管控制权,并且在接管期间的所有操作都不会被记录下来,以此保护隐私。即使遇到买错东西或订错酒店的情况,Operator也会在继续行动之前请求人类确认。njI即热新闻——关注每天科技社会生活新变化gihot.com

面对可能存在的风险,如诈骗网站,OpenAI引入了一个提示注入监视器,类似于防病毒软件的功能,可以在发现可疑行为时立即停止操作。这标志着L3级别的智能体时代正式到来,而OpenAI也重申了其对2025年的展望——这一年将是智能体之年。njI即热新闻——关注每天科技社会生活新变化gihot.com

随着Operator的发布,未来几个月内,人们或有望见证更多智能体的出现。它们将进一步扩展动作空间,适应更加广泛的应用场景,开启下一轮人机交互革命。目前,Operator仅限于美国的ChatGPT Pro(付费服务)用户试用,不过未来很快会向更多用户提供服务。njI即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-323-0.htmlOpenAI智能体能像人那样使用电脑,向实现通用人工智能迈进一步

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:网上选、线下逛,买特产、购服务 数据中的年货滋味

下一篇:最后一条染色体成功创建,合成酵母基因组“拼图”完成

为你推荐
1月21日,美国总统唐纳德·特朗普宣布,美国开放人工智能研究中心(OpenAI)、软银和甲骨文公司将联合成立名为“星际之门”的新公司。未来4年,这3家...
01-24
人形机器人产业作为发展新质生产力的代表领域之一,正在进入发展上升期,成为科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用...
01-27
  日前,在辽宁省政府新闻办举行的2024年全省经济运行情况系列第一场新闻发布会上获悉,2024年,辽宁GDP增...
01-22
  近日,省农业农村厅发布《辽宁省蚕遗传资源保护名录》,经论证评估,鲁黄、黄安东、胶蓝等13个品种列入保...
02-18
  1月20日,北京住房公积金管理中心(以下简称“公积金中心”)发布《关于开展提取住房公积金直付...
01-21
  中新经纬1月17日电 (万可义)“今年打算继续扩大销售网点,线上线下实体一起打开欧洲其他国家市场。”谈及中国电动出行产品的海外销售,意大利福建侨商联合会会长刘振钢近日...
01-21
北京时间 1 月 24 日,据英国《金融时报》报道,欧盟已承诺帮助陷入困境的欧洲汽车行业,可能会通过实施覆盖整个欧盟的补贴计划来提振电动汽车需求。欧盟委员会执行副主...
01-24
1 月 29 日消息,特斯拉公司宣布,其 Cybertruck 车主现在可以在所有 V4 超级充电站享受更快的充电速度。此前,特斯拉于上个月开始逐步推出这一快速充电功能。1 月 28 日...
01-29
  张硕  近年来,剧集市场出现了一种“历史考据+悬疑叙事+当下表达”的微观历史剧,在真实的历...
01-22
  1、《难哄》桑延在小说中是在第63章知道真相,他知道温以凡当初改志愿拒绝自己的真正原因了。  2、知道真相的那一刻,桑延十分懊悔又心痛,他自责为什么当初没能察觉到温...
02-20
21世纪经济报道记者 闫硕 北京报道近日,在国家医保局召开的“保障人民健康 赋能经济发展”新闻发布会上,国家医保局价格招采司司长丁一磊在...
01-24
21世纪经济报道记者 唐唯珂 广州报道“一到冬天就食欲大增,公司年会将近,想到要穿晚礼服就头大……现在打完一周之后,体重从76.6公斤掉到了74...
01-29
日前,辽宁大学马克思主义学院与沈阳“九·一八”历史博物馆共建活动在辽宁大学崇山校区图书馆学术报告厅...
01-21
央广网北京10月29日消息(记者 吴佳怡)即将到来的十一月,有哪些需要关注的高考热点?近日,阳光高考信息平台对...
01-22
  摘要  苹果市场走势主要由“预期”和“预期差”这两个关键词主导。收购初期,受弱现实影响,...
01-21
  风控踩雷、治理“失序”、业绩承压,每一重危机都似一座大山,如何迎难而上,改善业绩,成为贵阳银...
01-22
星座配对一直是人们关注的话题,其中双子座男和处女座女的组合备受瞩目。他们之间的配对...
01-22
在星座学中,摩羯男和金牛女是一个非常有趣的组合。两个土象星座的结合,他们之间有着相似...
01-22
石家庄时尚盛宴:揭秘模特T台走秀的光彩时刻当我走进石家庄的时尚中心,目光所及之处尽是华丽的灯光、绚烂的服饰,以及那些熠熠生辉的模特。在这个为期数天的T台走秀活动中,观众们...
02-12
闯入时尚潮流:道程服饰的风格与魅力在我的生活中,时尚往往不仅仅是衣服的选择,它反映了个人的品位与态度。如今,越来越多的人开始关注潮流服饰,而道程潮流服饰正是其中一道独特的...
02-17
1.《哪吒2》票房影史第一,周边商品卖到脱销要问这个春节档,热度最高的影片是哪部,答案非《哪吒之魔童闹海》(下称《哪吒 2》)莫属。据猫眼专业版数据显示,目前《哪吒2》总票房已超...
02-07
2月14日消息,苏宁易购与美的召开2025年度战略合作会议,加力投入以旧换新。锚定年度200亿战略目标,双方将深化联合创新、服务体验、终端运营等方面合作,上新超70款新品。抢滩春季...
02-15
2月24日消息,叮当健康科技集团有限公司公告称,相对于截至2023年12月31日止年度净亏损约2.31亿元,公司预期2024财年净亏损将增加64%以上。图源:东方财富网叮当健康表示,以上亏损主...
02-25
3月2日消息,携程旅游网络技术(上海)有限公司近日获第二届“上海慈善奖”捐赠企业奖。图源:携程黑板报公众号据介绍,在乡村振兴方面,携程全力打造“乡村旅游振兴”战略,通过规模化赋...
03-03
近日,智算时代云计算基础软件企业上海云轴科技股份有限公司(以下简称“云轴科技 ZStack”)在当前经济形势与资本市场复杂多变的环境中突围,成功获得北...
02-07
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
《华纳大乱斗》的游戏总监对上周五宣布的该免费格斗游戏第五季将成为最终季一事,发表了看法。 上周五,开发商Player First Games证实,第五季将于5月30日结束,距离...
02-04
近日,在接受西班牙媒体Gamereactor采访时,《怪物猎人:荒野》制作人辻本良三和总监德田优也被问及了游戏是否会登陆Switch 2的问题,虽然两人明显没有透露任何有关Sw...
02-13
蛇年春节前夕一条拍摄于编组站的铁路版贪吃蛇短视频在网络上走红相关话题迅速冲上热搜吸引众多网友点赞留言“我还说能有多像……打开以后真的很像”“这家伙还能连续变道”...
02-07
当地时间2月6日,美国马萨诸塞州联邦法官乔治·图尔将联邦雇员接受特朗普政府“买断计划”的最后期限推迟至2月10日。法官在裁决中表示,在相关法律问题得到进一步审理之前,该计...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮