清华团队与合作者推出大语言模型RealSafe-R1

1年前 来源:中国新闻网 观看:129

 HFI即热新闻——关注每天科技社会生活新变化gihot.com

中新网北京2月24日电 (记者 张素)2月23日,清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。研发团队代表介绍说,实验数据表明RealSafe-R1安全性提升显著,“安全增强版DeepSeek”可为更多应用提供可靠坚实基座。HFI即热新闻——关注每天科技社会生活新变化gihot.com

连日来,国产开源大模型DeepSeek的优异表现备受关注,其在自然语言处理和多任务推理方面的能力展现了强大的技术实力,尤其是在复杂问题解决和创造性任务中表现出色。业内专家同时提醒,DeepSeek R1和V3在面对一些安全性挑战时仍存在一定的局限性。HFI即热新闻——关注每天科技社会生活新变化gihot.com

针对“安全对齐机制不足”这一当前开源大模型的通病,清华瑞莱联合团队提出基于模型自我提升的安全对齐方式。“大模型的安全性瓶颈是本质的,只有通过持续投入和攻坚补齐短板弱项,人工智能产业才能真正实现高质量发展。”瑞莱智慧首席执行官田天说。HFI即热新闻——关注每天科技社会生活新变化gihot.com

据介绍,研发团队将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。具体来说,研发团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。HFI即热新闻——关注每天科技社会生活新变化gihot.com

实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间“跷跷板”现象。有评论认为,这为开源大模型安全发展与风险治理提供了创新性解决方案。HFI即热新闻——关注每天科技社会生活新变化gihot.com

田天表示,RealSafe-R1各尺寸模型及数据集,将于近期向全球开发者开源。他进一步指出,这一创新成果将为开源大模型的安全性加固提供有力支持,也为政务、金融、医疗等场景的应用提供更为可靠的坚实基座。(完)HFI即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:清华瑞莱联合团队:“安全增强版DeepSeek”可为应用提供坚实基座)HFI即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-2115-0.html清华团队与合作者推出大语言模型RealSafe-R1

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:学者成功研发出磁性软材料逆向编程技术

下一篇:宇树科技CEO王兴兴与母校共启上海宝山上大通用机器人研究院

为你推荐
  大众网记者 王一刚 报道  这个冬至,让我们和艺术撞个满怀……  为全面贯彻教育部发布的《关于全面实施学校美育浸润行动的通知》,“以美育浸润学生、以美育浸润教...
01-21
  大众网记者 王一刚 报道  为进一步贯彻落实济南高新区教育文体部“三美”教师师德专题培训内容,加强师德师风建设,提升教师队伍素质,济南高新区玺悦幼教集团(玺悦园、...
01-21
  2024年12月30日,中国信托业协会发布《2023—2024中国信托业社会责任报告》(以下简称《报告》)...
01-24
  四家上市险企业绩预增  股债共振推动利润预期改善  □记者 张小洁 北京报道  中国太...
02-05
白羊座男生通常被认为是热情、冲动和直率的代表。他们对待感情非常认真,一旦爱上一个人...
01-22
天蝎座男生通常被认为是神秘、深沉而又充满魅力的存在。他们对爱情有着极高的要求,很难...
01-22
当红女星,惊艳绽放的魅力之路在娱乐圈,亮眼的明星总是让人心生向往,而那些令人惊艳的女明星更是层出不穷。她们的美丽、才华,以及独特的个人风格,使她们在不断变化的时尚潮流中脱...
02-07
揭秘谜尚潮流服饰:让你走在时尚前沿的秘密武器在如今这个追求个性的时代,服饰已不仅仅是遮体的工具,更是一种文化的体现和个人风格的表达。而提到潮流服饰,谜尚的名字总是会引起...
02-12
2月7日消息,中国商业联合会今日发布2月份中国零售业景气指数(CRPI)。2月份,中国零售业景气指数(CRPI)为50.1%,环比下降1.0个百分点。分析认为,今年春节的大宗年货消费集中在1月份,CRP...
02-07
阿里苹果或将联手,为iPhone开发AI功能一则重磅消息,让阿里股价再创阶段新高。2月11日晚间,据The Information援引知情人士消息称,苹果为了应对在中国市场销售下滑的局势,正积极寻...
02-13
2月22日消息,快手近日携手湖南省循环农业产业发展协会及众多涉农行业协会,共同见证“快手湖南农资平台启动暨行业联谊座谈”的圆满落幕。此次盛会以“携手共筑三农服务新生态,...
02-23
2月25日消息,京东集团宣布,鉴于目前外卖骑手的平均薪酬远低于京东快递小哥,为了薪酬公平性,未来一段时期签约的外卖全职骑手缴纳五险一金的所有成本,包含个人所需缴纳部分,全部由...
02-25
由爱奇艺出品,新力量文化、新影方舟、老有影视联合出品,新力量文化承制,爱奇艺奇正工作室打造,惠楷栋执导,解嬿嬿编剧,谭卓、高叶、刘奕君领衔主演,林雨申特邀领衔出演,扈耀之、田小...
01-21
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
根据国外游戏论坛IconEra管理员爆料,SIE已不再计划将《恶魔之魂》和《GT赛车7》移植到PC平台。 关于《GT赛车7》,爆料称原本有一个PC版正在开发中,但最终被取消...
02-03
近日暴雪游戏国服运营团队宣布,战网正式调整登录方式。用户需要使用网易通行证登录战网,但完全切换的时间稍作推迟,未来需要使用网易账号才能登录游戏。 暴雪游...
02-13
中国贸促会新闻发言人就美方宣布对中国输美产品加征10%关税发表谈话美国东部时间2月1日,美方以芬太尼等问题为由,对中国输美产品加征10%关税。中国工商界对此深表遗憾、坚决反...
02-02
极目新闻记者 周治涛“这一杯要敬侄女,感谢去年直播帮我卖山货赚了几千元。”大年初二,家住湖北宜昌鄂西山区五峰土家族自治县的曾春林,到舅舅家拜年,饭桌上舅舅对她连连致谢。...
02-04
做企业,实际上是做文化。当员工在面对市场苦寻出路,或在诱惑面前左右摇摆之时,文化将成为指引他们找寻正路、穿越周期的明灯。刚刚过...
01-21
从空间太阳能发电到破解大脑基因密码,再到由真菌制造的自我修复材料,《欧盟研究与创新》杂志盘点了2025年有望大放异彩的创新技术。这些成果拥有广阔...
01-21
已经立春了,天气啥时候变暖?在冷空气的频繁打压下沈阳最低气温已连续多日低于-20℃明天就是春节假期结束第...
02-05
  2月7日,来自辽宁省邮政管理局的监测数据显示,今年春节假期(1月28日至2月4日),辽宁省快递业务揽收量1578....
02-08
  中新经纬1月17日电 据商务部网站17日披露,2024年全国吸收外资8262.5亿元人民币。  2024年,全国新设立外商投资企业59080家,同比增长9.9%;实际使用外资金额8262.5亿元人民...
01-21
  资生堂提价容易增长难    新年涨价已经成为资生堂的惯例。近日,资生堂宣布将在4月对旗下多款产品进行涨价,涨幅在2%―10%不等。2024年2月,资生堂就宣布过一轮涨价。实际...
01-21
1 月 26 日消息,多年来,除了对续航里程、充电速度和基础设施的担忧之外,选择不购买电动汽车的消费者常常将电动汽车的高价作为一个主要因素。然而最新研究显示,电动汽车...
01-27
2 月 3 日消息,特斯拉官网显示,特斯拉现已在美国上线推出针对FSD用户的保险优惠政策,车主在车辆激活FSD系统并保持90分以上安全驾驶评分的前提下,最高可获得 7 折-8 折...
02-04
  1、《难哄》不是《偷偷藏不住》的第二季,这两部剧是姊妹篇,都是根据同一个作者的小说改编的。  2、按照时间线来看的话,《难哄》的时间线要在《偷偷藏不住》之前,前者讲...
02-15
最近,“协商的技术男主是谁演的”成为了热门话题。这部作品自宣传阶段就吸引了大量关注,播出后更是让观众感到惊喜,不负众望。在韩剧《协商的技术》中,李帝勋饰...
02-21
21世纪经济报道记者季媛媛 上海报道 “复星医药私有化复宏汉霖”有了定论。1月22日,复星医药发布公告,控股子公司复星新药拟以现金及/或换...
01-23
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向两部门:2025年底前 所有省份要将省内异地住院...
02-05
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮