小红书首次开源文本大模型

4个月前 来源: 观看:71

6月9日消息,小红书近日开源了首个大模型——dots.llm1。KkX即热新闻——关注每天科技社会生活新变化gihot.com

dots.llm1是一个中等规模的Mixture of Experts(MoE)文本大模型,由小红书 hi lab(Humane Intelligence Lab,人文智能实验室)团队研发,总参数量 142B,激活参数 14B。KkX即热新闻——关注每天科技社会生活新变化gihot.com

具体来说,在激活14B参数的情况下,dots.llm.inst模型在中英文通用场景、数学、代码、对齐任务上的表现亮眼,与 Qwen2.5-32B-Instruct、Qwen2.5-72B-Instruct相比具备较强的竞争力。同时与Qwen3-32B相比,在中英文、数学、对齐任务上表现接近。KkX即热新闻——关注每天科技社会生活新变化gihot.com

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:小红书KkX即热新闻——关注每天科技社会生活新变化gihot.com

此外,dots.llm1最大特色是使用了11.2万亿token的非合成高质量训练数据,这在现阶段的开源大模型中非常罕见。KkX即热新闻——关注每天科技社会生活新变化gihot.com

今年以来,小红书在AI、大模型方面的动作频频。年初,小红书内部大模型技术与应用产品团队升级为hi lab,并启动了“人文训练师”的招聘,邀请有深厚人文背景的研究者加入到对AI的训练中,将人类更全面的智慧和价值感注入AI,最终让AI成为人类有益的伙伴。KkX即热新闻——关注每天科技社会生活新变化gihot.com

5月27日,小红书hi lab与复旦大学哲学学院共同成立“AI人文人才训练营”,展开AI后训练相关的人文课题共创,培养“AI+人文”复合型人才。大模型的训练通常分为预训练(pre-train)和后训练(post-train)两个阶段。人文训练就属于后训练的一部分,对AI在人性化表达、人类价值对齐等方面的表现起到关键作用。KkX即热新闻——关注每天科技社会生活新变化gihot.com

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:小红书KkX即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-12-34324-0.html小红书首次开源文本大模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:京东工业与音飞储存达成战略合作

下一篇:淘宝开始用火箭送快递

为你推荐
2月5日消息,朋湖网近日联合机器人开放社区发布“2024年度科技产业系列榜单”,商越科技凭借自身的采购数字化技术创新、服务能力、市场竞争力及社会价值,入选“2024企业服务创新...
02-07
已经闹上法庭。1、三只羊公司被起诉过去了这么久,没等到小杨哥复出,却等来了三只羊的官司。近日,据天眼查消息,合肥三只羊网络科技有限公司、广州市美诚食品有限公司等新增一则...
02-13
这份作业抄的不错。1、美团上线美食社区产品美团这次又悄悄地搞了一波大的。据悉,1月21日,美团在苹果应用商店App Store上线了一款名为“鸭觅”的美食社区产品,其slogan是“一...
02-07
3月4日消息, 飞猪“AI行程助手”将于明日上线,该产品集成了DeepSeek-R1及阿里云通义千问旗下主力模型的能力,是在线旅游行业首个融合多个大模型的AI产品。届时,用户在飞猪APP底...
03-05
春雪食品集团股份有限公司(证券代码:605567)于2025年1月20日发布了2024年年度业绩预盈公告,预计实现归属于母公司所有者的净利润670.00万元至800.00万元,与上年同期相比成功扭亏...
01-21
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
已经登陆多平台的奇幻背景建造主题RPG游戏《神箱 - Mythology of Cube -》(日版)官方宣布将推出国际版,预定1月30日登陆Steam、PlayStation5/4、Nintendo Switch平...
01-24
《刺客信条:影》未发布的故事及角色细节,通过一家成人卡通网站泄露了出去。 上周末,该游戏当前尚未发布的艺术设定集扫描件被发布在一个成人动漫网站上,随后被发行...
02-05
今天(2月3日)上午第九届亚洲冬季运动会火炬传递仪式在黑龙江哈尔滨启动火炬传递时间为1天传递总路线长约11公里火炬传递起点定在哈尔滨市道外区中华巴洛克街区这里是哈尔滨城...
02-03
买了机票,选座这样的附加服务,一般是谁先到谁先得,消费者鲜有异议。但一段时间以来,部分航空公司开始对这一基本服务引入加价机制,选择靠窗、靠过道或经济舱前排等座位都要额外支...
02-06
图源:pixabay1月17日晚间,思科瑞(688053.SH)发布公告称,公司收到四川证监局出具的《行政监管措施决定书》。据上述文件,思科瑞在2022年...
01-21
美国麻省理工学院科学家受昆虫启发,成功研制出一款邮票大小的飞行机器人。这款机器人能在空中飞行15分钟,超过以往所有昆虫大小飞行机器人的飞行时长...
01-22
  新华社济南2月12日电(记者丛佳鑫)农历正月十四太阳落山后,山东省烟台市黄渤海新区古现街道的渔...
02-14
  我省扩内需、促消费再迎政策加码。近日,省商务厅、省发展改革委等九部门联合印发《关于促进服务消费...
02-18
新春临近,位于广州市荔湾区的岭南花卉市场一派热闹景象。在岭南地区,逛花市是春节必不可少的活动。作为全国大型花卉批发零售市场,岭南花卉市场本周迎来年花销售高峰期,逾千种花...
01-22
  当地时间20日,俄罗斯总统普京在联邦安全会议常务委员视频会议上表示,俄方对与美国新的行政当局就乌克兰冲突开展对话持开放立场。  普京表示,在调解乌克兰冲突中,最主...
01-22
1 月 27 日消息,鸿蒙智行官方今日公布了旗下车型新年 OTA 升级详情,新版本将支持eAES 增强型自动紧急转向、新年主题 ADS App 等功能。附鸿蒙智行新年 OTA 升级详情如...
01-28
2 月 4 日消息,从小米汽车获悉,2 月 5 日起,小米 SU7 Ultra 将在全国 42 城 112 店正式开放静态品鉴。全新专属产品专家“Ultra Master”将与用户联系,安排、服务品鉴。...
02-04
  1、《树下有片红房子》陈欢尔和宋丛没有在一起,宋丛暗恋过陈欢尔,但陈欢尔的官配是景栖迟。  2、宋丛是品学兼优的学霸,高中时为陈欢尔补习过功课,是个心思细腻但比较内...
02-18
最近打开社交应用,经常能看到关于《痞子无间道》第8集剧情的讨论。这部剧的粉丝们对此非常关注,今天就来聊聊这一集的内容。在第8集中,费仁在大飞的房间里寻找...
02-19
21世纪经济报道记者 闫硕 北京报道2月11日,广州公共资源交易中心发布了《关于公布各批次集采中选药品合同签订和供应情况的通知》(简称“通...
02-13
21世纪经济报道记者 闫硕 北京报道HPV是一种易感染人体表皮和黏膜鳞状上皮的病毒,已被发现有两百多种型别,根据致癌性的不同分为高危型别和...
02-18
  大众网记者 杨涛报道  近日,在第十六届山东省大学生科技节——山东省大学生消防安全技能大赛中,青岛港湾职业技术学院应急管理学院23级建筑消防技术与应急救援技术专...
01-21
1月15日,正值习近平总书记考察皇姑区三台子街道牡丹社区三周年之际,辽宁大学纪检监察学院与皇姑区三台子...
01-21
  原油期货在上周走高后本周维持震荡,从当前市场逻辑来看,分析人士认为,短期原油价格向上驱动不...
01-24
  原标题:又见共管保险箱被撬!浙金信托一产品爆雷后被监管认定存在四大问题  来源:界面新闻 ...
01-28
射手座的男生天性热情开朗,喜欢自由自在地生活。他们追求刺激和冒险,对于感情也是如此。...
01-22
水瓶座的男生通常被认为是聪明、独立和有点神秘的人。他们喜欢自由和独处的时间,所以在...
01-22
一米七腿粗男生怎么穿搭?一、一米七腿粗男生怎么穿搭?男的一米七个子是比较矮的,这样的人身材墩实,腿又粗又短,搭配衣服是一件难的事情,我建议应该搭配一些颜色比较浅的衣服,最好是...
02-12
如何穿搭的小技巧?跟街拍达人学穿搭,做一个时尚的酷girls,你会发现更美的自己街拍是一种时尚文化,也是对潮流的诠释。每一位出现在摄影师镜头中的时尚专家都是时尚达人。他们的...
02-17
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮