清华团队与合作者推出大语言模型RealSafe-R1

1年前 来源:中国新闻网 观看:123

 QLv即热新闻——关注每天科技社会生活新变化gihot.com

中新网北京2月24日电 (记者 张素)2月23日,清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。研发团队代表介绍说,实验数据表明RealSafe-R1安全性提升显著,“安全增强版DeepSeek”可为更多应用提供可靠坚实基座。QLv即热新闻——关注每天科技社会生活新变化gihot.com

连日来,国产开源大模型DeepSeek的优异表现备受关注,其在自然语言处理和多任务推理方面的能力展现了强大的技术实力,尤其是在复杂问题解决和创造性任务中表现出色。业内专家同时提醒,DeepSeek R1和V3在面对一些安全性挑战时仍存在一定的局限性。QLv即热新闻——关注每天科技社会生活新变化gihot.com

针对“安全对齐机制不足”这一当前开源大模型的通病,清华瑞莱联合团队提出基于模型自我提升的安全对齐方式。“大模型的安全性瓶颈是本质的,只有通过持续投入和攻坚补齐短板弱项,人工智能产业才能真正实现高质量发展。”瑞莱智慧首席执行官田天说。QLv即热新闻——关注每天科技社会生活新变化gihot.com

据介绍,研发团队将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。具体来说,研发团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。QLv即热新闻——关注每天科技社会生活新变化gihot.com

实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间“跷跷板”现象。有评论认为,这为开源大模型安全发展与风险治理提供了创新性解决方案。QLv即热新闻——关注每天科技社会生活新变化gihot.com

田天表示,RealSafe-R1各尺寸模型及数据集,将于近期向全球开发者开源。他进一步指出,这一创新成果将为开源大模型的安全性加固提供有力支持,也为政务、金融、医疗等场景的应用提供更为可靠的坚实基座。(完)QLv即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:清华瑞莱联合团队:“安全增强版DeepSeek”可为应用提供坚实基座)QLv即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-2115-0.html清华团队与合作者推出大语言模型RealSafe-R1

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:学者成功研发出磁性软材料逆向编程技术

下一篇:宇树科技CEO王兴兴与母校共启上海宝山上大通用机器人研究院

为你推荐
  大众网记者 司心鹏 报道  2024年,菏泽医学专科学校护理系坚持以立德树人为根本任务,全面落实“护教协同、岗课赛证”综合育人模式,构建了以校内竞赛为驱动、省级大赛...
01-21
  大众网记者 秦瑾 通讯员 祁凯丽 报道  12月20日,章丘区大中小学思政课一体化协同创新联盟成立暨大中小学思政课教学展示活动在齐鲁师范学院附属中学(章丘中学)报告厅...
01-21
  《科创板日报》1月14日讯(记者 余诗琪)时隔3年,微医再次出现在港交所的IPO申请列表中。  这...
01-21
  保险公司拿到了黄金市场的“入场券”。  2月7日,金融监管总局发布《关于开展保险资金投资...
02-13
在星座学中,人们常常相信星座之间存在着某种神秘的联系和吸引力。其中,双鱼男和射手女之...
01-22
冷战是一种常见的情感处理方式,但对于狮子男他们往往更难以忍受这种冷漠的态度。如果你...
01-22
优质男喜欢女生什么穿搭?一、优质男喜欢女生什么穿搭?喜欢穿有品味的衣服,合适自己身材的衣服,所以女生懂得搭配衣服真的很重要,因为女生如果懂得搭配的话,就可以把自己最美的一面...
02-12
170胖子穿搭男生秋季冬季?一、170胖子穿搭男生秋季冬季?170算中等身高吧,当然也会有腿偏短的情况,看个人的实际身材体型了。秋冬季的搭配选择还是挺多的,秋天相对来说会比较凉快...
02-22
2月4日消息,春节假期,京东联合联通数智智慧足迹,对全国31个城市的线下商圈客流量及消费数据进行了实时动态统计,反映消费者在春节线上线下各场景中的消费趋势。观察显示,西安、哈...
02-07
赚钱,无孔不入。1.大小品牌挤进爆火直播间一切生意的本质都是流量,在抖音尤是如此。不知道大家有没有发现,从去年开始,大小品牌开始挤进抖音爆火直播间,通过砸钱给主播送礼物,以此...
02-11
今年以来,白酒市场“控货潮”不断,近期,习酒也加入了控货行列。2月20日,有市场消息称贵州习酒销售有限责任公司发布公告,根据窖藏系列...
02-22
2月26日消息,2月中旬以来,国内赏花游的热度如春潮般涌动,途牛截至目前最新预订数据显示,樱花、油菜花、桃花、杏花等春季限定赏花主题旅游产品预订热度提升显著。热门客源地方面...
02-27
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
今日(2月6日),VR挖掘机模拟游戏《DIG VR》Steam页面公布,预计于2025年3月20日发售,游戏支持简繁体中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 《DIG ...
02-07
发行商Hooded Horse近日宣布,中古时期策略游戏《庄园领主》销量已突破300万份,官方对玩家的支持表示了衷心感谢。 《庄园领主》最初于2024年4月26日在Steam上发...
02-10
据网络平台数据截至2月5日13时29分2025年春节档上映新片(含春节档结束后)总票房(含点映及预售)突破100亿!截至2月5日9时2025年春节档总观影人次突破1.87亿超2024年春节档总观影人...
02-05
从“缴纳猫税”(海外用户发布宠物照片)到互相请教数学/英语,再到对工作时间、生活方式的提问,小红书无疑是国内外这几天最受关注的几...
01-21
央视网消息:近日,中央社会工作部等8部门联合出台措施,指导加强快递员、网约配送员服务管理,推动构建和谐劳动关系,切实维护各方合法权益。措施提出,推进...
01-21
  近日,载有南美进口水果的“演奏者”轮在大连集装箱码头开启卸船作业,装有4400吨新鲜车厘子和200吨蓝...
01-21
辽宁省气象台1月25日16时发布寒潮黄色预警  预计,26~29日全省气温自西向东陆续下降,大部地区累计降温幅...
01-27
  中工网讯 (工人日报-中工网记者黄洪涛 通讯员阿胡)9.9元体验课,是“馅饼”还是“陷阱”?近日,江苏省消保委发声提醒,平台应履行审查义务,完善评价机制,保障消费者知情权和选...
01-22
  春节临近  近日  广东、河南、辽宁的  一些城市已明确  2025年可以  有序、限时或在限定区域  燃放烟花爆竹  01  关于烟花爆竹燃放,多地官宣  东...
01-22
1 月 24 日消息,如果你正在犹豫是否选择电动汽车(EV)作为下一辆新车,安全性很可能是一个重要的考虑因素。与传统的燃油车(ICE)相比,电动汽车究竟更安全还是更具风险?澳大利...
01-25
1 月 26 日消息,宝马首席开发官 Frank Webber 近日在接受 Motor Authority 采访时表示,iDrive X 的屏幕已经足够大,没有必要继续增大。“如果车内有太大的屏幕,会让你与...
01-27
  1、《滤镜》小说原著就叫《滤镜》,这是桐华所著的作品,桐华也是这部剧的总编剧。  2、这是一部充满科幻色彩的现代剧,一共三十集,讲的是由一个神秘的高科技产品“滤镜手...
02-17
  1、《树下有片红房子》景栖迟一开始喜欢过祁琪,但那也只是男生对漂亮女生的一种浅浅心动和好感罢了。  2、景栖迟真正知道喜欢是什么样的感觉,还是在认识陈欢尔之后,他...
02-18
21世纪经济报道记者 韩利明 上海报道2024年,对于中国生物医药企业而言,似乎尚未走出“资本寒冬”。医药魔方数据显示,中国医疗健康领域一级市...
02-06
编者按:一个人工智能(AI)机器人,在短短8天内独立完成了668项实验,合成了668种化合物,并成功研发出一种全新的化学催化剂。这一壮举令人赞叹。AI...
02-11
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮