【译】生成考古学:AI 创建古代世界的真实图像

原作:Ming

引子:历史令人着迷,但很难想象几千年前的世界是什么样子。

 

许多方面造成了这一困难。部分原因是古代人有不同的审美观。在 1400 年代之前,画家很少考虑透视,使得事物的比例在现代人看来相当奇怪。部分原因是时间已经腐蚀掉了文物中的很多细节。陶器、雕塑和建筑物随着时间的推移而褪色。例如,您知道埃及的吉萨大金字塔是白色的,有一个金色的盖子吗?这些因素使得今天的人们很难准确地领略古代之美。

最近,我了解到人们使用人工智能为过去的场景创建图像。我将这种趋势称为“生成考古学”。

  • 几十年来,一些街头摄影师一直在使用人工智能来拍摄 20 世纪 90 年代中国的真实照片。
  • 几个世纪以来,一些艺术家一直在创作具有戏剧性风格的重要历史场景(例如俄罗斯革命)和重要人物(例如圣女贞德)的图像。

我心想:为什么不把时间拉得更远,回到几千年前呢?

古代美索不达米亚地图

我一直对美索不达米亚历史很感兴趣,所以我决定从那里开始。几个文明在该地区漫游:苏美尔人、亚述人、巴比伦人、阿卡德人等等。我应该从哪里开始?

作为一名游客探索地方时,我总是发现图画地图很有帮助。简而言之,图形地图会降低制图的准确性;作为交换,它展示了重要的兴趣点,例如旅游景点、当地植物和动物以及重要地标。让我们看看 MidJourney 能为我们提供什么。这是我的提示:

[prompt] 公元前 2000 年左右的古代美索不达米亚图画,像鸟瞰图一样稍微倾斜,描绘了乌尔、乌鲁克和巴比伦等重要城市。底格里斯河和幼发拉底河清晰可见。河流和城市都用英语和楔形文字标记。

经过几次改进,这就是我得到的结果:

当然,您不应该相信这张地图适合您的下一次时间旅行冒险。缺陷非常明显:

  • 没有清晰的标签,无论是英文还是楔形文字。
  • 这张地图上没有提到美索不达米亚。我原以为每个城镇至少有一座金字形神塔。
  • 建筑和帆看起来就像外星科技。这到底是什么?

美索不达米亚的鸟瞰图就这么多了。城市里的风景怎么样?

乌尔的一个典型市场

古代美索不达米亚艺术主要是为神灵或皇室成员服务的,尤其是雕塑。我想知道普通人典型的一天会是什么样子。

这是我用 MidJourney 生成的场景:

[prompt] 公元前 2039 年左右苏美尔古城乌尔繁忙市场的照片。前景中,一群不同的人从事着不同的职业,包括一名在泥板上书写楔形文字的抄写员、三名在该地区巡逻的士兵、一名路过的农民和几名出售手工艺品的商人。街角有一家酒吧。窗边,有人正在用吸管喝啤酒。远处,你可以看到金字形神塔。人们穿着适合其职业的传统古代美索不达米亚服装。

多么热闹的小镇啊!你几乎可以听到这张照片中动物和人的噪音。向 MidJourney 致敬,它做得非常出色,包括以下细节:

  • AI在前景中加入了一只山羊。在时间上,美索不达米亚人驯化山羊已有 6000 年历史,完全契合。
  • 街道已铺好。这也是相当准确的——古代美索不达米亚人被认为是第一个铺设道路的文明。
  • 窗户是用木条格栅的。由于考古遗址中的木制物品在被发现时通常已经腐烂,因此很容易被遗忘。 MidJourney 记得将它们纳入其中这一事实值得赞扬。

当然,还有几个方面可以改进:

  • 尽管我要求一张照片,人工智能还是生成了一幅绘画。
  • 我特意要的酒吧啤酒在哪里? 美索不达米亚啤酒因面包屑而变得混浊,人们不得不用芦苇吸管喝饮料,正如《时间之谜》团队的这段视频中所描绘的那样。
  • 远处建筑物顶上那个看起来像断头台的东西是什么?对我来说似乎存在安全隐患。

除了明显的错误之外,还有几点我不确定:

  • 建筑。大多为两层高,顶部平坦。这是相当准确的,巴比伦房屋2600年前的红土模型就证明了这一点。然而,我对房屋维护不善的状况表示怀疑。当他们在此生活居住时,房屋的状况不应该更好吗?
  • 衣服。 确实,长袍和头巾在古代乌尔很常见,但说实话,我期待更多的装饰。

用人工智能生成东西的大部分乐趣在于随机性。您可以拥有无​​限数量同一主题的插图(只受预算限制)。以下是我使用相同提示生成的其他几个场景:

在此图中,我们看到了更多类型的牲畜,包括羊(左下)和牛(右下)。

此版本具有几个不同的细节:

  • 天花板顶部(左中)和地面上(右下)的罐子和篮子,似乎装着某种蘑菇。
  • 各个地方都挂着一串串谷物。看来是丰收的一年啊!
  • 窗户比前两幅画中的窗户小,这也许更准确。

尽管这些画作在美学上令人愉悦,但您可能会说它们只是描绘了所有中东市场常见的通用场景。我们可以强调古代美索不达米亚元素吗?

古亚述帝国的室内设计

1854 年,亚述学家奥斯汀·亨利·莱亚德 (Austen Henry Layard) 为亚述纳斯里帕二世 (Ashurnasrirpal II) 的亚述宫殿的大厅绘制了一幅插图:

这可能是迄今为止最详细(也是最可信)的亚述建筑内部绘画。我把它喂给 MidJourney 让它发挥想象力:

[prompt] 用单反摄影重新粉刷这个房间。这是亚述纳斯里帕二世 (Ashurnasrirpal II) 亚述宫殿的一个大厅。这是来自古代亚述帝国。与巴比伦文化、阿卡德文化、苏美尔文化相似,它们都来自美索不达米亚。

在手动挑选图像约 5 次迭代后,我得到了这张图片:

这么多柱子! 在我看来,这个场景中显示的柱子像是埃及风格和波斯风格的完美结合,并大量应用了蓝色。 这个颜色让我想起了伊什塔尔门的釉料,在阳光下看起来应该相当闪亮。 在古代,青金石以其闪亮的蓝色而闻名。 考虑到青金石的稀缺性,古代亚述人可能将蓝色与较高的社会地位联系在一起,从而解释了蓝色在宫殿中的使用。 相比之下,莱亚德的画没有柱子,这是人工智能的创造性发明。

就像莱亚德的画一样,这幅生成的艺术品在墙上描绘了浮雕。 浮雕是古代美索不达米亚雕塑艺术的常见形式。 具体来说,我喜欢人工智能在左侧墙上的浮雕之上放置第二排浮雕(在面向我们的墙上)。 不过,我希望这些数字能更清晰一些。

给生活带来一丝安慰

说到浮雕,既然我们已经做到了,为什么我们不尝试从浮雕中生成对某人的真实描绘呢?

这幅来自尼努尔塔神庙的浮雕被大都会博物馆收藏,描绘了一个长着翅膀的男人,也许也是一位神,其名不详:

我让 MidJourney 将他想象成一个真实的人:

[prompt] 这个人可是在现实世界的照片中。他有翅膀。他左手握着一株植物的一部分,这株植物的三个枝条末端都是莲座丛。这个人物来自古代亚述帝国。与巴比伦文化、阿卡德文化、苏美尔文化相似,它们都来自美索不达米亚。

这已经相当不错了!面部特征捕捉得非常好。他看起来也更有权威:

  • 他不再用左手向下握住枯萎的玫瑰花结,而是像权杖一样将植物高高举起。
  • 他的衣服更加对称(尽管人工智能再次未能捕捉到褶边)。

不过,整件事看起来仍然像一座雕塑。如果你看看他的翅膀和衣服,很难想象他是如何飞的,甚至是走路的。尽管如此,这与他以前在圣殿里的样子相比,已经是一个巨大的飞跃了。

后记

简要回顾一下。在这篇文章中,我展示了一些人工智能生成的关于古代亚述的艺术作品。从航空地图的例子中,我们看到人工智能在执行以下任务时惨败:1)需要关注太多细节,2)缺乏足够的训练数据(我想图画地图在古代美索不达米亚并不是很流行)。另一方面,它在历史上艺术家充分探索的主题(即市场)、细节较少的场景(即室内)和单身人士肖像方面表现出色。

规划

接下来,我计划扩展生成古代人物肖像的想法。例如:在 1882 年的 Lookbook Costumes of All Nations 中,第 4 页“古代”一章中描绘了战前亚述军队的场景:

这个插图非常逼真,看到真人穿着这些服装是不是很酷?

意义

“生成考古学”具有巨大的教育价值。 许多人有兴趣了解古代文化,但插图的稀缺和历史文物的获取(想想:发掘现场、博物馆、古董店……)可能会阻碍他们的好奇心。 这对年轻人来说更为严重,因为场景经历构成了想象力!。

借助生成式人工智能,一切都会变得更好。 我们可以把草图变成栩栩如生的图画。 在艺术为权贵保留的时代,我们可以展示普通公民的生活是什么样子。 通过将人工智能技术引入历史教育项目,我们将迎来令人兴奋的可能性。

posted @ 2024-01-26 13:14  白鹿原老张  阅读(30)  评论(0编辑  收藏  举报