使用人工智能填补古代文本的空白

科技2020-11-05 23:22:15
导读恩里克·希门尼斯利用人工智能填补了3000年前早期城市社会中文士在粘土片上写下的幸存文本中的许多诱人差距。单个角色通常可以在明确的

恩里克·希门尼斯利用人工智能填补了3000年前早期城市社会中文士在粘土片上写下的幸存文本中的许多诱人差距。

单个角色通常可以在明确的阅读和令人费解的难题之间产生差异。EnriqueJiménez是古代近东研究的专家,致力于重建世界文学的起源。美索不达米亚是第一个真正文明的家园,大约在公元前2500年左右出现了丰富的双语文学文化。它的文本用粘土片上的楔形文字书写在苏美尔和阿卡德。这些文本只能以片段形式存在,许多片段只能测量几厘米。Jiménez和他的同事面临的挑战是确定属于一起的部分 - 脚本本身是多价的,语义依赖于高度依赖于上下文。“由于缺少单个标志而不得不放弃对文本的处理令人非常沮丧,特别是当你知道必须有某个片段填补空白时。”

恩里克·希门尼斯(EnriqueJiménez)在人工智能的帮助下为自己设定了填补这些痛苦差距的目标,并获得了亚历山大·冯·洪堡基金会(Alexander von Humboldt Foundation)颁发的索菲亚·科瓦列夫斯卡娅奖(Sofia Kovalevskaya Prize),以帮助他实现这一目标。该奖项旨在使初级学者能够在自己选择的领域开展创新研究项目。Jiménez选择在LMU进行他的项目,在那里他在Assyriology研究所和古代历史系担任双重任命,他的电子巴比伦文学研究小组就在那里。他和他的团队已经开始组建一个“片段馆”,一个数据库,世界博物馆中的所有文本片段都将找到它们的位置。该项目于2018年5月开始,数据库现在包含大约10,000个片段。“我希望大约15岁,

大英博物馆有40,000个碎片

Assurbanipal在2700年前在他的首都尼尼微建立了他的图书馆,旨在汇集他那个时代所收集的知识和智慧。在他去世后,图书馆被公元前612年征服该城市的巴比伦人摧毁,其馆藏被粉碎。考古学家回收的大部分碎片现在都在伦敦大英博物馆。其中大约一半尚未被破译 - 恩里克·希门尼斯与博物馆合作,将这项任务作为其项目的一部分。5月,该博物馆的两名工作人员开始拍摄该机构持有的其他粘土片,而Jiménez及其团队将在未来5年内制作4万张碎片楔形片的照片。

多年来,Jiménez一直在探索数字媒体开辟的机遇。首先,他自己编写了简单的程序。现在他与数据科学家密切合作。在耶鲁大学期间,他参与了Cuneiform评论项目,该项目旨在发表关于古代美索不达米亚文学的在线评论。他还在一个专门的网站上提供他的研究成果。他目前正在参与培训该计划,以“阅读”阿卡德语,并认识到所有可能的阿卡德语文本中使用的符号读数。“目标是让程序能够识别字符序列,它可以自动插入到适当的上下文中。这对于计算机来说比对我们人类来说更容易。计算机可以立即考虑所有可想到的可能性,

希讷尼斯本人专注于在公元前一千年伊拉克时期流传的文学文本 - 当时阿克卡文文学处于蓬勃发展的状态 - 以及以诗歌形式写成的文本。在整个项目过程中,Jiménez打算开发一个包含大约10,000行的文本语料库。在这项努力中,他与巴格达大学的Anmar A. Fadhil博士合作,他在巴比伦北部着名的西帕尔图书馆策划了一个文学平板电脑档案。希腊历史学家贝罗索斯的生命跨越了公元前4世纪至公元3世纪的转折,解释了据称它是如何产生的:当诺亚得知大洪水迫在眉睫时,在他登上方舟之前,据说他埋葬了在登上方舟之前,在西帕尔市的整个美索不达米亚着作。西帕尔位于现今巴格达附近,但其图书馆仅在1986年被发现。其中包括史诗“Enumaeliš”(巴比伦版本的创作,以及“非常漂亮的文字”),Jiménez )和大洪水的描述。“一方面,这些文本与我们熟悉的故事截然不同。另一方面,不同版本之间存在很多相似之处,包括主题相似之处。我们与伊拉克同事一起计划发布最重要的文学片。其中之一是关于“正义之人的苦难”的诗歌片段,这是巴比伦作品的故事。“ Enumaeliš“(创作的巴比伦版本,以及”一个非常漂亮的文本,“Jiménez说)和大洪水的描述。”一方面,这些文本与我们熟悉的故事非常不同。另一方面,不同版本之间存在很多相似之处,包括主题相似之处。我们与伊拉克同事一起,计划出版最重要的文学片。其中一个是关于“正义之人的苦难”的诗歌的一部分,这是巴比伦工作的故事。“ Enumaeliš“(创作的巴比伦版本,以及”一个非常漂亮的文本,“Jiménez说)和大洪水的描述。”一方面,这些文本与我们熟悉的故事非常不同。另一方面,不同版本之间存在很多相似之处,包括主题相似之处。我们与伊拉克同事一起,计划出版最重要的文学片。其中一个是关于“正义之人的苦难”的诗歌的一部分,这是巴比伦工作的故事。“ 包括不同版本之间的主题相似之处。我们与伊拉克同事一起,计划出版最重要的文学片。其中一个是关于“正义之人的苦难”的诗歌的一部分,这是巴比伦工作的故事。“ 包括不同版本之间的主题相似之处。我们与伊拉克同事一起,计划出版最重要的文学片。其中一个是关于“正义之人的苦难”的诗歌的一部分,这是巴比伦工作的故事。“

这首诗讲述了一个正义男人的故事,然而他却遭受了多次惩罚。在文本的中点,主角首先受到惩罚,然后赦免,并在梦中收到赦免的消息。Jiménez和Fadhil能够将Sippar图书馆的短文本片段分配给诗歌中的梦想剧集,从而填补了之前已知版本的空白。“我们现在能够解读这段经文,过去2000年没有人能够阅读。我们重建了一个被认为是古代经典的文学文本,并为现今的读者拯救了它。”

希讷尼斯还发现了一首献给巴比伦神马尔杜克的赞美诗片段。“我所处理的文本都是诗歌文本。阿卡德语诗歌的编写方式中间有明显标记的caesura。将这种诗意结构翻译成德语非常困难。” 在学术出版物中,文本通常逐字翻译成英文。EnriqueJiménez已将重新组合且现在完整的行翻译成德语,下面给出的英文版本是该文本的免费呈现(新发现的短语以斜体显示):

“马杜克,你的愤怒就像一场汹涌的洪水,

但是在早晨,你的怜悯给你的受害者带来安慰,

可怕而可怕的风暴已经减弱,

海浪在那里轰鸣,海岸现在平静, 你现在拥有

黑暗威胁的云彩照。

当灼热的烈日狂风呼啸,你的阳光明媚的日子,现在统治 “。

研究人员可以从这些关于古代美索不达米亚日常生活的文本中学到很多东西 - 关于他们每天处理的物品以及一般的社会生活。“正义之人的苦难”描述了主人是如何醒来并与他的随行人员交谈的 - 这段经文表明他有一个仆人,他的职责包括早上醒来他的主人。

“就其功能而言,巴比伦的文学与我们的文学并没有太大差别,”Jiménez说。经典作品不断被复制,主要是因为它们是学校阅读和写作教学的典范段落的来源。但是,创造史诗在传统上为庆祝新年的到来而举行的节日中被公开朗诵。巴比伦经典也遭遇了一种即使在今天仍然很熟悉的命运:它们经常被模仿。“这些模仿告诉我们很多关于美索不达米亚人民与他们自己的传统之间的关系。例如,”正义之人的痛苦“中的一行被略微修改,以便把它变成一个笑话。我们有一个非常对现代世界文学传统的态度相似。一方面,

不幸的是,已经研究过的模仿中存在许多空白,因为许多平板电脑曾经遭受过一次或多次损坏。“我相信,在计算机的帮助下,我们将能够在未来40到50年内重建整个阿卡德文学。对我们来说,数字媒体只是工具:我们不是在抽象算法我们想用它们来建立录制的文本。如果不了解它的文学经典,就不可能理解任何文明。“

免责声明:本文由用户上传,如有侵权请联系删除!