解码古文字,AI助力古代历史研究

11个月前 来源:新华网 观看:254

从金融到医学,人工智能(AI)正深刻改变着现代生活。如今,它开始进军古代文本研究:从希腊与拉丁典籍到中国甲骨文,人工神经网络正成为解读古文字的钥匙。它不仅能驾驭浩瀚档案,填补字符空缺,还能解码几乎无迹可寻的罕见或灭绝语言,令古代智慧在现代科技之光下重现辉煌。dWc即热新闻——关注每天科技社会生活新变化gihot.com

2023年10月,费德里卡·尼科拉尔迪收到了一封电子邮件,邮件附带的一张图片彻底改变了她的研究。此图显示了从公元79年维苏威火山浩劫中幸存的一卷莎草纸残骸,它于18世纪在赫库兰尼姆古城的一处豪华别墅遗迹中被发现。这些历经沧桑的莎草纸,曾是数百卷古籍之一,却因岁月侵蚀而变得脆弱不堪,多数已无法展开。dWc即热新闻——关注每天科技社会生活新变化gihot.com

尼科拉尔迪是意大利那不勒斯大学的一名莎草纸学者,她曾参与一项利用AI读取难解文字的研究。而今,她见证了一项奇迹:图片上,一片莎草纸带上,希腊字母密布如织,于幽暗中焕发新生。dWc即热新闻——关注每天科技社会生活新变化gihot.com

这一名为“维苏威挑战”的项目只是AI重塑古代历史研究的“冰山一角”。dWc即热新闻——关注每天科技社会生活新变化gihot.com

神经网络重建古代文本dWc即热新闻——关注每天科技社会生活新变化gihot.com

几十年来,计算机一直被用于对数字化文本进行分类和分析,但目前最令人兴奋的是神经网络的使用。神经网络由相互连接的节点组成的分层结构组成,尤其是具有多个内部层的“深层”神经网络。dWc即热新闻——关注每天科技社会生活新变化gihot.com

卷积神经网络(CNN)模型能够从这些图像中精准捕捉网格状数据结构。CNN模型在光学字符识别领域大放异彩的同时,也开辟了其他多元化的应用途径。例如,中国研究团队在探索甲骨文时,巧妙地运用这些模型来复原遭受严重侵蚀的文字图案,深入分析甲骨文随时间的演变轨迹,并将破碎的文物碎片重新拼凑起来,重现历史原貌。dWc即热新闻——关注每天科技社会生活新变化gihot.com

与此同时,循环神经网络(RNN)作为一种专为处理线性序列数据设计的模型,开始展现出在搜索、翻译以及填补已转录古代文本缺失内容方面的巨大潜力。RNN已被用于为古巴比伦时期数百份格式严谨的行政和法律文本提供缺失字符的智能化建议。dWc即热新闻——关注每天科技社会生活新变化gihot.com

那么,神经网络能否在历史的残片中找出人类专家难以发现的联系?2017年,英国牛津大学的一项合作开启了探索之旅,当时,两名研究人员正面临破解西西里希腊铭文的难题。dWc即热新闻——关注每天科技社会生活新变化gihot.com

古典学者通常依赖对现存文本的理解来诠释新材料,但难以全面掌握所有相关资料。牛津大学研究人员认为,这正是机器学习可发挥作用的领域。他们使用基于RNN的Pythia模型,并用数万份希腊铭文来训练它,最终成功预测了文本中缺失的单词和字符。dWc即热新闻——关注每天科技社会生活新变化gihot.com

2022年,他们又推出Ithaca模型,不仅能预测缺失内容,还能为未知文本提供日期和来源地建议。Ithaca利用了Transformer模型的突破,能捕捉更复杂的语言模式。当前风靡全球的聊天机器人,如OpenAI的ChatGPT就是基于Transformer模型。dWc即热新闻——关注每天科技社会生活新变化gihot.com

翻译复原浩瀚历史档案dWc即热新闻——关注每天科技社会生活新变化gihot.com

韩国研究人员有一项棘手的任务:整理世界上规模最大的历史档案之一。该档案详细记录了27位朝鲜王国国王自14世纪至20世纪初统治时期的日常,涵盖数十万篇文章。美国纽约大学机器翻译专家金亨俊表示,这些文本数据量极为庞大。dWc即热新闻——关注每天科技社会生活新变化gihot.com

将这些文本人工译成现代韩文,预计需耗时数十年。金亨俊携手韩国同行,利用Transformer网络训练自动翻译系统。结果显示,AI译文在准确性和可读性上远超古韩文,有时甚至优于现代韩文。dWc即热新闻——关注每天科技社会生活新变化gihot.com

对于仅存少量文本的古代语言,研究人员也会采用神经网络进行破解。希腊帕特拉斯大学的卡特里娜·帕帕瓦西里欧及其团队,利用RNN恢复了克里特岛诺索斯迈锡尼泥板中缺失的线性文字B文本。测试显示,模型预测准确性高,且常与人类专家建议相符。dWc即热新闻——关注每天科技社会生活新变化gihot.com

面临验证与利用双重挑战dWc即热新闻——关注每天科技社会生活新变化gihot.com

利用AI破解古文字依旧面临诸多挑战。AI技术使非专业人士也能接触到大量古代文献,如何确保研究成果准确无误,成为了首要挑战。神经网络的强大虽令人瞩目,但其偶尔产生的误导性结果,即“幻觉现象”,也让人对结果的可靠性产生担忧。dWc即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志指出,为解决这一问题,人文科学专家与计算机科学家需携手合作,共同研究并验证AI的解读结果。同时,提倡将所有相关数据(包括原始文本、扫描文件、训练模型及算法)实行开源,以此提升研究的透明度与可验证性。这一做法被称为“数字来源链”,旨在构建一个从原始数据到最终结论的完整链条,便于任何人回溯并核实研究过程。dWc即热新闻——关注每天科技社会生活新变化gihot.com

此外,随着数字化文本数量的激增,如何有效利用这些庞大的数据资源,从中提炼出关于古代社会的重要信息,也是研究人员面临的新课题。这要求研究者转变视角,从单一的文本分析转向对整体文化的深入理解,并尝试将不同地域、不同时期的文本数据相互关联,以获得更为全面的认识。dWc即热新闻——关注每天科技社会生活新变化gihot.com

从金融到医学,人工智能(AI)正深刻改变着现代生活。如今,它开始进军古代文本研究:从希腊与拉丁典籍到中国甲骨文,人工神经网络正成为解读古文字的钥匙。它不仅能驾驭浩瀚档案,填补字符空缺,还能解码几乎无迹可寻的罕见或灭绝语言,令古代智慧在现代科技之光下重现辉煌。dWc即热新闻——关注每天科技社会生活新变化gihot.com

2023年10月,费德里卡·尼科拉尔迪收到了一封电子邮件,邮件附带的一张图片彻底改变了她的研究。此图显示了从公元79年维苏威火山浩劫中幸存的一卷莎草纸残骸,它于18世纪在赫库兰尼姆古城的一处豪华别墅遗迹中被发现。这些历经沧桑的莎草纸,曾是数百卷古籍之一,却因岁月侵蚀而变得脆弱不堪,多数已无法展开。dWc即热新闻——关注每天科技社会生活新变化gihot.com

尼科拉尔迪是意大利那不勒斯大学的一名莎草纸学者,她曾参与一项利用AI读取难解文字的研究。而今,她见证了一项奇迹:图片上,一片莎草纸带上,希腊字母密布如织,于幽暗中焕发新生。dWc即热新闻——关注每天科技社会生活新变化gihot.com

这一名为“维苏威挑战”的项目只是AI重塑古代历史研究的“冰山一角”。dWc即热新闻——关注每天科技社会生活新变化gihot.com

神经网络重建古代文本dWc即热新闻——关注每天科技社会生活新变化gihot.com

几十年来,计算机一直被用于对数字化文本进行分类和分析,但目前最令人兴奋的是神经网络的使用。神经网络由相互连接的节点组成的分层结构组成,尤其是具有多个内部层的“深层”神经网络。dWc即热新闻——关注每天科技社会生活新变化gihot.com

卷积神经网络(CNN)模型能够从这些图像中精准捕捉网格状数据结构。CNN模型在光学字符识别领域大放异彩的同时,也开辟了其他多元化的应用途径。例如,中国研究团队在探索甲骨文时,巧妙地运用这些模型来复原遭受严重侵蚀的文字图案,深入分析甲骨文随时间的演变轨迹,并将破碎的文物碎片重新拼凑起来,重现历史原貌。dWc即热新闻——关注每天科技社会生活新变化gihot.com

与此同时,循环神经网络(RNN)作为一种专为处理线性序列数据设计的模型,开始展现出在搜索、翻译以及填补已转录古代文本缺失内容方面的巨大潜力。RNN已被用于为古巴比伦时期数百份格式严谨的行政和法律文本提供缺失字符的智能化建议。dWc即热新闻——关注每天科技社会生活新变化gihot.com

那么,神经网络能否在历史的残片中找出人类专家难以发现的联系?2017年,英国牛津大学的一项合作开启了探索之旅,当时,两名研究人员正面临破解西西里希腊铭文的难题。dWc即热新闻——关注每天科技社会生活新变化gihot.com

古典学者通常依赖对现存文本的理解来诠释新材料,但难以全面掌握所有相关资料。牛津大学研究人员认为,这正是机器学习可发挥作用的领域。他们使用基于RNN的Pythia模型,并用数万份希腊铭文来训练它,最终成功预测了文本中缺失的单词和字符。dWc即热新闻——关注每天科技社会生活新变化gihot.com

2022年,他们又推出Ithaca模型,不仅能预测缺失内容,还能为未知文本提供日期和来源地建议。Ithaca利用了Transformer模型的突破,能捕捉更复杂的语言模式。当前风靡全球的聊天机器人,如OpenAI的ChatGPT就是基于Transformer模型。dWc即热新闻——关注每天科技社会生活新变化gihot.com

翻译复原浩瀚历史档案dWc即热新闻——关注每天科技社会生活新变化gihot.com

韩国研究人员有一项棘手的任务:整理世界上规模最大的历史档案之一。该档案详细记录了27位朝鲜王国国王自14世纪至20世纪初统治时期的日常,涵盖数十万篇文章。美国纽约大学机器翻译专家金亨俊表示,这些文本数据量极为庞大。dWc即热新闻——关注每天科技社会生活新变化gihot.com

将这些文本人工译成现代韩文,预计需耗时数十年。金亨俊携手韩国同行,利用Transformer网络训练自动翻译系统。结果显示,AI译文在准确性和可读性上远超古韩文,有时甚至优于现代韩文。dWc即热新闻——关注每天科技社会生活新变化gihot.com

对于仅存少量文本的古代语言,研究人员也会采用神经网络进行破解。希腊帕特拉斯大学的卡特里娜·帕帕瓦西里欧及其团队,利用RNN恢复了克里特岛诺索斯迈锡尼泥板中缺失的线性文字B文本。测试显示,模型预测准确性高,且常与人类专家建议相符。dWc即热新闻——关注每天科技社会生活新变化gihot.com

面临验证与利用双重挑战dWc即热新闻——关注每天科技社会生活新变化gihot.com

利用AI破解古文字依旧面临诸多挑战。AI技术使非专业人士也能接触到大量古代文献,如何确保研究成果准确无误,成为了首要挑战。神经网络的强大虽令人瞩目,但其偶尔产生的误导性结果,即“幻觉现象”,也让人对结果的可靠性产生担忧。dWc即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志指出,为解决这一问题,人文科学专家与计算机科学家需携手合作,共同研究并验证AI的解读结果。同时,提倡将所有相关数据(包括原始文本、扫描文件、训练模型及算法)实行开源,以此提升研究的透明度与可验证性。这一做法被称为“数字来源链”,旨在构建一个从原始数据到最终结论的完整链条,便于任何人回溯并核实研究过程。dWc即热新闻——关注每天科技社会生活新变化gihot.com

此外,随着数字化文本数量的激增,如何有效利用这些庞大的数据资源,从中提炼出关于古代社会的重要信息,也是研究人员面临的新课题。这要求研究者转变视角,从单一的文本分析转向对整体文化的深入理解,并尝试将不同地域、不同时期的文本数据相互关联,以获得更为全面的认识。dWc即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-278-0.html解码古文字,AI助力古代历史研究

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:着力降低人工智能应用门槛

下一篇:日本人工智能应用潜力仍存

为你推荐
1月14日,记者从中国科学院合肥物质科学研究院等离子体物理研究所(以下简称“等离子体所”)获悉,由该所建设运行的国家重大科技基础设施“聚变堆主机关...
01-21
最近,“静电颜色挑战”在网络上走红,大量网友跟风模仿。许多社交媒体博主称,当两个相爱的人接触时,如果产生的静电呈粉色,那么说明他们之间是“真爱”,而...
01-23
  2月7日,来自辽宁省邮政管理局的监测数据显示,今年春节假期(1月28日至2月4日),辽宁省快递业务揽收量1578....
02-08
  今明两天(2月7日至8日),寒潮继续影响我国,中东部气温将陆续迎来这轮过程的最低点,并将大面积创今...
02-08
新闻通讯员 木子春运承载着亿万游子对家乡的眷恋与期盼,春节的脚步近了,归心似箭的人们纷纷踏上返乡之路。据交通运输等部门预计,今年春运全社会跨区域人员流动量将达到90亿人...
01-22
  中新经纬1月20日电 题:数字经济将引领产业合作新模式  作者 朱岩 清华大学互联网产业研究院院长  数字经济步入高速发展快车道。2024年7月党的二十届三中全会明确了...
01-21
1月15日,阿维塔中心南京大明路店隆重开业,作为阿维塔大家庭中的新成员,南京大明路中心店集展示、销售、售后服务为一体,让众多热爱阿维塔品牌的朋友近距离感受阿维塔“与众不同...
01-21
2 月 3 日消息,特斯拉官网显示,特斯拉现已在美国上线推出针对FSD用户的保险优惠政策,车主在车辆激活FSD系统并保持90分以上安全驾驶评分的前提下,最高可获得 7 折-8 折...
02-04
  1、《树下有片红房子》陈欢尔和景栖迟在一起了,两人在打打闹闹中沉淀下了深厚的感情,互相陪伴彼此走过了艰难的时光。  2、虽然宋丛先喜欢的陈欢尔,但陈欢尔只是把他当...
02-18
《余烬之上》男主是谁的孩子?男主是谁扮演的?《余烬之上》有双男主,廖思远和廖知白是兄弟,他们是廖氏夫妇的孩子。剧中,一场十年前的大火让廖氏兄弟廖知白和廖思...
02-21
  广州日报讯(全媒体记者张青梅通讯员吴丽婷、魏星)七岁的小李正处于身心快速发展的关键时期...
01-21
21世纪经济报道记者李佳英 广州报道对多数患者来说,福斯曼的倒闭消息如晴天霹雳,突如其来。“广州齐遇口腔门诊部(福斯曼)总部出现经营困难,拖...
02-15
    葛墨林在为本科生上课。南开大学供图  人物小传  葛墨林,1938年出生于北京,中国科学...
01-21
在孩子的成长过程中,家庭教育担任的角色越来越受到重视。假期是家庭教育的关键时期,也是加强家校联系的重...
01-21
  近日,中国太平保险集团有限公司在香港成功发行了亚洲首只采用双风险、双触发机制的巨灾债券...
01-21
  或因禁止手工补息与非银同业存款利率自律管理倡议效果逐步显现,2024年多家银行出现存款规模...
01-24
在爱情的世界里,有时候我们会遇到一些花心的男人。其中,双子座的男生就以善变、多情而著...
01-22
星座配对一直是人们关注的话题,其中狮子座男和巨蟹座女的组合备受瞩目。他们之间的互动...
01-22
日系穿搭特点?一、日系穿搭的特点在穿搭方面日系风简直把休闲做到了极致,要说亚洲潮流文化发祥地,原宿绝对是一大圣地这里除了有常见的时尚大牌,还有亲民的牌子,日系穿搭的主要特...
02-07
休闲衬衫搭配什么裤子和鞋子好看?一、休闲衬衫搭配什么裤子和鞋子好看?休闲衬衫搭配什么裤子 配阔腿牛仔裤 随着复古的阔腿裤回归,阔腿裤的搭配越来越灵活。 最常见的韩范妹子...
02-12
2月6日消息,A股电商SaaS第一股光云科技宣布,旗下快麦小智已接入并支持DeepSeek。据介绍,快麦小智是基于自然语言交互和个性化推荐技术搭建的对话式营销服务一体化智能客服机器...
02-07
1月20日消息,截至2024年12月底,1688PLUS会员数已突破1000万。1688PLUS会员是1688在2022年6月面向买家推出的付费会员产品,开卡即可获得商品价格优惠、平台红包补贴及官方专享服...
02-07
2月21日消息,银联国际日前与阿联酋本地转接网络Al Etihad Payments(AEP)签署合作协议,双方将在阿联酋当地共同推动发卡行发行“银联-Jaywan”双品牌卡,提升当地居民日常消费、跨...
02-22
3月7日消息,飞猪宣布,自今年3月起,每月8日都将举办“全球旅行节”促销,首期2025年3月的“全球旅行节”报名商品总数已破万件。针对每月8日的促销活动,飞猪持续丰富营销渠道,加大流...
03-09
2024年,全球宏观经济环境复杂多变,国内经济弱复苏背景下,固定收益市场成为投资者的重要选择。债券市场配置需求旺盛,收益率曲线平坦化,投资者对固定收益类基金的关注度显著提升。...
01-21
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
发行商 Knight Peaks 和开发商 Owlcat Games 宣布,CRPG游戏《开拓者:拥王者》在推出 6 年后,已突破 200 万销量大关。 游戏于去年 9 月正式迎来了 6 周年纪念日,...
01-28
2月11日,开发商Tlon Industries发布了2D建造冒险游戏《Kentum》的Steam试玩Demo,该Demo允许玩家体验游戏开始部分内容,包括第一个区域、制作机器、装饰基地等。 S...
02-11
北京时间2月3日凌晨,单板滑雪世界杯阿斯本站男子坡面障碍技巧决赛,中国选手苏翊鸣状态回升,凭借稳健的表现以78.36分获得亚军,为中国选手拿下该项目首枚世界杯奖牌!冠军归属加拿...
02-03
记者今天(8日)从最高人民检察院获悉,十四届全国政协人口资源环境委员会原副主任李微微涉嫌受贿一案,由国家监察委员会调查终结,移送检察机关审查起诉。日前,最高人民检察院依法以...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮