AI 作画领域中的“神笔马良”是怎样炼成的?
本文由行者AI携手亚马逊云科技共同推出
刷爆朋友圈的 AIGC 是什么?
AI Generated Content (AIGC,利用人工智能技术来生成内容),是继专业生产内容(PGC, Professional-generated Content)、用户生产内容(UGC, User-generated Content)之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势。
2022年是 AIGC 爆火的一年,迭代速度更是呈现出指数级爆发,年初还处于技艺生疏阶段,几个月之后有些作品就达到专业级别,足以以假乱真,这给职业创作人带来了惊喜和灵感。无可否认的一点是,AIGC 正在逐步渗透越来越多的生活场景,短视频、直播、主持、晚会舞台等领域随处可见 AIGC 的痕迹,AIGC 也给如文字创作、图像创作、视频创作、音频剪辑、游戏开发和代码生成等内容生态注入了新鲜血液。近期 AI 作画火遍全网,只要简单输入几个关键词,几秒钟内一幅画作就能诞生,且绝大多数人都难以看出其究竟是人手所作还是 AI 所作。在今年的某次人工智能大会上,AI 甚至以闪电般的速度复原了《富春山居图》,技惊四座。这背后深度学习模型的不断完善、开源模式的推动、大模型探索商业化的可能,都成为了 AIGC 发展的“加速度” 。
AIGC 为什么会火出天际?
从产品和技术层面出发,AIGC 之所以在2022年实现破圈,Stable Diffusion 的开源功不可没。Stable Diffusion 在2022年下半年开源后引发了广泛关注并长期霸占 GitHub 热榜第一名,在短短几个月时间内出现了大量基于 Stable Diffusion 模型的二次开发。Stable Diffusion 开源的不仅仅是代码,还有其已经训练好的模型,这意味着后继开发者能更好地借助这一开源项目,挖掘出更丰富的内容生态,从而大幅降低用户使用 AIGC 进行创作的门槛,提升创作效率。
另外,Stable Diffusion 的开源,也为更广泛的 C 端用户普及起到至关重要的作用,AIGC 绘画之所以能够帮助大众画出各种天马行空的画作,背后离不开大量深度学习模型的不断完善。未来,随着模型的稳定,开源将成为 AIGC 成熟的催化剂,开源模式有望让相关模型成为海量应用和服务的基础,应用层面的创造力有望迎来拐点。
AIGC 目前的挑战有哪些?
数据、算力、算法是驱动 AIGC 发展的三驾马车,要实现 AIGC 的发展,这三者缺一不可,但每一项的发展,都需要企业投入大量的资金,尤其是前期的硬件投资更是占企业投入资金的大多数,这就导致 AIGC 初创企业的经营成本居高不下。以新晋独角兽企业 Stability AI 为例,该公司为维护一个拥有4000块英伟达 A100 GPU 组成的算力群,总计花费超5000万美元。
从 AI 生成图像到 AI 生成视频要用到大量数据训练模型,对算力要求呈指数级的提升,同时也需要快速高效的方式来处理数据集,所以在云中训练和部署人工智能模型也成了很多 AIGC 公司的新选择。过去的经验表明,较高的前期投入要求 AIGC 的企业用户规模需要迅速扩张,因为只有行业用户规模达到一定体量,才能够摊平成本,扭亏为盈。而云计算的高可用性、高扩展性、根据业务规模按需扩展、按用量付费等优势,恰恰为 AIGC 的发展注入了新的机遇。对于很多中小型公司来说,在使用云服务的同时,也能够利用这些平台提供的 AI 服务完成自己所需要的功能架构。
亚马逊云科技一站式机器学习平台
Amazon SageMaker 助力 AIGC
亚马逊云科技提供完全托管的一站式机器学习平台 Amazon SageMaker,它提供了从数据工程到模型开发、训练、调优、部署、持续管理等方面的各项核心功能,以及全球首个面向机器学习的集成开发环境 SageMaker Studio,化繁为简,让开发高质量 AIGC 模型(比如 Stable Diffusion 模型)变得更加轻松,让“一个人”的团队也可以轻松实现 AIGC 算法的生产化。
此外,Amazon SageMaker 不仅支持多种算力机型,还可以实现资源的弹性扩张,能够敏捷适配业务扩展不同阶段的需求。同时,Amazon SageMaker 同一终端节点部署多模型的方式可以帮助企业节省实时部署成本,其异步推理形式还支持“从0扩展”,从而进一步降低推理成本,大大加快客户应用机器学习技术的速度。另外,SageMaker JumpStart 最新提供两种最先进的模型:Stable Diffusion 和 Bloom,用于图像和文本的生成。用户可以通过 JumpStart 一键部署或微调众多预训练模型,轻松开发高质量模型并缩短部署时间。
在全球市场研究机构 IDC 最新发布的《2022年亚太地区(不含日本)AI 生命周期软件工具和平台供应商评估》中,凭借 Amazon SageMaker 强大、丰富且灵活的功能,广泛的交付能力及对开源项目的持续贡献,亚马逊云科技获评 AI 生命周期软件领导者。
行者 AI 基于 Amazon SageMaker
实现快速高效的 AI 作画解决方案
成都潜在人工智能科技有限公司(行者 AI)成立于2020年5月20日,致力于使用人工智能和机器学习技术提高游戏和文娱行业的生产力,并持续改善行业的用户体验。公司业务领域涵盖游戏 AI、智能内容安全系统、智能数据平台等多个方面。针对海内外游戏、UCG 平台、现代素质教育、数字化社会建设等多行业,行者 AI 致力于用数十年沉淀的专业 AI 技术,与亚马逊云科技 SageMaker 深度绑定,可结合产品为用户及行业提供全栈式解决方案,致力成为人机交互中的“神笔马良”。
行者 AI 基于 Amazon SageMaker 构建 AIGC SaaS 平台,利用 Amazon SageMaker Notebook 将 AIGC 模型发布至 SageMaker Inference Endpoint,通过输入作画关键词直接调用这些模型并生成用户需要的图片。SageMaker Inference Endpoint 会自动根据平台调用情况进行底层 GPU 实例的弹性伸缩, 保证平台能够随时支持平台用户使用。另外,平台也可以上传样本图片进行模型微调(Fine-Tunning),触发自动化工作流,自动调用SageMaker 训练任务进行训练,并且可以将微调后的模型进行自动部署,用户调用相应接口即可获得符合预期的图片。
“通过与亚马逊云科技的合作,我们将大量的训练和线上生产环节转移到 Amazon SageMaker 中,可以帮助我们将算力资源很好地分配给开发人员。让我们惊喜的是,我们将研发完成的模型进行上线部署的时候,可以很方便地实现一键部署和版本管理。这种与云上机器学习服务进行优势结合的方法使我们相信能够让众多游戏企业客户在更短的时间内获得 AIGC 所带来的价值。”
——成都潜在人工智能科技有限公司 COO
陈洪宇
行者 AI 作画解决方案的主要优势:
提高美术及内容创作行业效率。平台的定位并不是取代专业的美术以及内容创作行业人员,AI 对于行业来讲,更多的是提高生产效率。一幅要花2天时间画出来的画只需要数秒完成,让以前需要花数周的工作流程缩短到几天时间。
扩大图文生产力,帮助自媒体及 UCG 平台的内容创作者摆脱图文主题不匹配、图片成本高和版权受限等困境。为追求量化、标准化输出需求的用户提供耳目一新的视觉灵感和画面呈现,以最简易的操作门槛实现美术创作。
提供教育美术的智能学习平台。采用人工智能技术,在绘画过程中注入互动性与趣味性。以提升学生的兴趣、想象力、理解力为先导,提升美术教育的学习效率,让学生用绘画探索和认识世界。
可支持 AIGC 技术辅助社交平台软件。让大众用户在发帖、分享、交流的过程中使用 AI 作画成品,刺激增长用户的留存及日活,帮助平台搭建更加完善的生态社交系统。
配合 AI 音乐支持影音行业生产创作。针对音频、文字、游戏 CG 和背景的现实场景智能生成绘画、背景音乐以及视频,帮助企业降本增效的同时优化场景艺术概念、迸发创作灵感、提高创作能效。
目前,行者 AI 不仅在 2D 平面美术生成方面持续努力,还在 3D 资产生成生成方面都有所涉猎,包含 3D 环境、单体建筑、人物角色模型、虚拟数字人等复杂内容生成,为游戏、广告传媒、元宇宙等内容创作行业提供丰富多彩、生动形象的资产内容。
行者 AI 作画作品案例展示:
实例:灯光、黄昏、街边的复古花店