近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。
TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得模型更适用于广泛的应用场景,为用户提供了更准确、更深入的信息处理和生成能力。
TechGPT2.0发布后,受到了学术界的广泛关注,“开放知识图谱”“机器学习算法与自然语言处理”“始智AI”等平台相继对TechGPT2.0的工作进行了介绍。并且,相应的模型也开源到了GitHub、HuggingFace、始智AI、魔塔等国内外开源社区,并提供了在线体验服务。
据悉,与研究小组2023年6月26日发布的TechGPT-1.0相比,TechGPT2.0新加了许多领域知识。除了TechGPT-1.0 所具备的计算机科学、材料、机械、冶金、金融和航空航天等10余种垂直专业领域能力,TechGPT-2.0 还在医学、法律等领域文本处理上展现出优秀的能力,并扩充了对地理地区、运输、组织、作品、生物、自然科学、天文对象、建筑等领域文本的处理能力。TechGPT-2.0还对幻觉、不可回答、长文本处理等问题进行了能力增强。同时,TechGPT-2.0对部署的硬件要求更低,使用NVIDIA 4090单机单卡或昇腾910A单机单卡就可完成TechGPT-2.0模型部署。
本文链接:http://www.gihot.com/news-8-254-0.html东北大学研究团队发布TechGPT2.0大语言模型
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇:地衣和苔藓保护长城免受侵蚀
下一篇:内蒙古大学领导班子调整
点击右上角微信好友
朋友圈
点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮
点击右上角QQ
点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮