​左手 Serverless,右手 AI,7 年躬身的古籍修复之路

作者:宋杰

“AI 可以把我们思维体系当中,过度专业化、过度细分的这些所谓的知识都替代掉,让我们集中精力去体验自己的生命。我挺幸运的,代码能够有 AI 辅助,也能够有 Serverless 解决我的运营成本问题。Serverless 它是一个 Game Changer,就是彻底改变云计算模式的创新。

我叫宋杰,是一个上海人。从初级的程序员一直到做企业的架构工作,现在是在利用 IT 技术做古籍方面的开发与利用。

数字化对古籍有一个非常大的好处在于它的修复是异常高效的,传统的古籍修复对人才的要求门槛是很高的,但数字化就创造了另外一种可能。首先,修改相对简单,另外,它还可以做版本跟踪。 即便我这一次修复不成功,后面的人可以根据原始图片再次修改,让古籍资源能够充分地活化起来。

机缘巧合下,我承担了这个任务。

印藏项目源于香港的一位私人收藏者,他收藏了历朝历代的印谱后把这些印谱的数字化版本,无偿的捐献给了复旦大学图书馆。

图片

我第一次尝试着以 IIIF 对印藏项目进行大规模的呈现。在互联网这样可能产生极高流量波峰波谷的环境下,到底怎么去设计它的架构,才能既满足业务的需要,又比较经济呢?

阿里云提供的 Serverless 技术尤其是函数计算产品,对于整个项目帮助极大,它性价比相当的高,根据经验估算来说,每次收费基本上是等于单机开发的 10%。

其实像复旦大学印谱文献虚拟图书馆这样的网站,它的原始图像就有 3TB,近 50 万张图片,包括现在已经用 AI 识别的图片,整个运营费用一年下来也就几千元,而传统的方式一个月的话就要花费 2000 元左右。

图片

原来大家做网站开发,第一考虑是要用什么 web 服务器,后端用什么数据库。但 Serverless 出现之后,已经把底层的这些操作系统、应用软件、容器编排全部抽象掉了。

对大多数程序员来说,需要解决的是领域问题。不用去关心下面的运维问题,只需要把精力投入在怎么解决业务问题上去。

在计算方面,Serverless 也彻底帮助我们做到了计算和存储分离,算力的估算方式就发生了变化。在 Serverless 的环境当中,我们只需要指定它的内存大小、运行时间,给到这两个参数就可以把算力定下来了。而且你能支配的总容量其实是没有上限的,让程序员能彻底集中精力做应用的事。

图片

我现在做的项目,叫易图 IIIF 文化遗产图像解决方案,它是一个平台,可以说是对印藏项目的一般化。对于一些中小型的机构,甚至是个人收藏爱好者,他只要在网页上进行上传,就能够出现一个跟印藏一样的网站,这是我个人的创业项目。

“我的左手是 Serverless,右手是 AI”。 强人工智能是一定高度依赖于文化的,在某一个文化领域当中产生出符合文化与价值观、审美倾向,包括对世界的基本认知的一个智能的大模型。

要知道模型都挺大的,至少不能让我等 1 分钟才看到推理结果。阿里云通过函数计算来做 GPU 应用,并自研一套镜像快速部署方案,我的感受是体验非常流畅。同时整个过程是按需计费的,这对所有开发 AI 应用程序的程序员来说是一个福音,彻底让程序员能够集中精力做应用的事情。

我们迎来了开发者最好的时代。

古籍识别体验场景全新上线

中华古籍浩如烟海,对珍贵古籍进行保护、修复和活用,关乎中华文脉的延续和传承。随着数字技术不断成熟,古籍正走出“深闺高阁”,资源会得到更有效利用。轻点鼠标、一键部署,儒家经典《论语》可逐页在线阅览,古籍还能实现繁体字和简体字转换等功能,让读者能查询、会阅读。

为了让更多人了解古籍修复,宋杰与阿里云函数计算团队合作,通过函数计算一键搭建古籍识别平台,排版形式既符合现代人的阅读习惯,又还原了古籍纸张的阅读美感。欢迎大家参与到古籍修复的活动中,让古籍更好地走进千家万户。

图片

点击下方链接,参与古籍修复,用数字技术助力古籍活化。

https://developer.aliyun.com/topic/fcrepair

posted @ 2023-10-12 17:59  阿里云云原生  阅读(12)  评论(0编辑  收藏  举报