提示的艺术:为什么“提示工程”是未来的技能

提示的艺术:为什么“提示工程”是未来的技能

虽然在 AI 机器人中输入文字似乎不是一项技能,但摄影的历史表明它确实如此——而且它将在未来几十年内出现。

An image created using the A.I. Midjourney with a prompt of “poncho person in rainy tokyo alleyway many neon lights vaporwave — ar 16:9”

人工智能艺术应该获奖吗?

最近的纽约时报 文章 再次将人工智能艺术及其背后的所有争议带入了聚光灯下。这篇文章描述了科罗拉多州的游戏设计师 Jason Allen 如何通过提交 AI 生成的图像在艺术博览会上获得第一名。艾伦使用名为 Midjourney 的 AI 工具制作了这张图片。他的贡献范围基本上是在程序中输入一组单词。据艾伦说,他精心制作了用于制作最终艺术形象的提示(文本)。在数字艺术/数字操纵摄影类别下提交,一些评委直到颁奖后才知道图像是使用人工智能创建的。不过,在得知它的真正来历后,他们还是觉得应该拿下这个类别的第一名。

这个故事在推特上引发了一场关于艺术是否应该获胜的激烈辩论。促使人工智能创作艺术需要技巧吗?艾伦应该得到任何功劳吗? Twitter 上的一位用户嘲笑称,打字甚至可以被视为一种技能,他说:“我喜欢他们所说的‘改进提示’,就好像这是某种技能一样。”

其他人则声称,艾伦绝不是一位艺术家,而是一位为 AI 的工作赢得赞誉的合作者。

基于我们目前对人工智能艺术的文化理解,这些批评听起来完全正确。然而,它们也类似于早期对摄影的批评。

与摄影的相似之处

正如纽约时报的文章恰当地指出的那样,人工智能生成图像的引入类似于摄影的发明。当摄影成为一种广泛使用的图像捕捉工具时,许多声音也批评了该工具,认为它是对绘画的威胁。法国诗人和艺术评论家查尔斯波德莱尔声称摄影绝不是一门艺术。引用他的话说,摄影是“才华横溢的失败画家的避难所”。尽管有些人可能仍然认为摄影需要很少的天赋或者它不是一门真正的艺术,但它现在被广泛认为是一种艺术技能。学习捕捉光线、使用相机镜头等——这些都是现在成为摄影师必备技能的新技能。摄影也可以被认为是与相机的合作。创作者并没有制作场景,他们正在使用设备捕捉它。

就像摄影一样,人工智能生成的图像正在捕捉瞬间——它们在训练有素的机器学习模型中捕捉场景。 Francois Chollet 是著名的机器学习程序员,也是几本关于人工智能和机器学习的书籍的作者,他也将人工智能艺术与摄影进行了比较。他在推特上写道:“图像生成是一种摄影形式。在数以亿计的图像之间插入的潜在空间中进行摄影。当你拍照时,你不是在“创造”照片,而是拍摄它。你找到你想要的场景,然后以你想要的方式捕捉它。这是策展。”

Chollet 继续说:“您现在可以在插入过去人类创造的潜在空间中四处走动并拍照,而不是在现实世界中四处走动并拍照。潜空间摄影。就像摄影一样,它是艺术。它需要艺术家的眼睛。”

就摄影而言,那些迅速适应新技术的人通常会从中获利。从绘画转向摄影的艺术家在一个新兴领域取得了成功,而那些特别擅长绘画的艺术家则继续在他们的领域蓬勃发展。摄影的引入使所有人都可以使用肖像,而不仅仅是可以为优秀艺术家买单的精英。同样,也许人工智能生成的艺术正在让所有人都能接触到精美的、独一无二的艺术。

回到艺博会比赛,艾伦本质上是把摄影图像带入了绘画比赛。他使用了一种需要不同技能的尖端工具。摄影刚发明时,它并没有用来与绘画相提并论,它完全是另一种艺术。这就是为什么我认为比赛中应该有一个单独的“人工智能生成”类别,这样所有参赛者的工具都是一样的,而且它可以比较相似的技能组合。

磨练即时工程技能

作为一名机器学习艺术家,我也相信即时工程(将文本输入 AI 以创建图像)是一种技能。也许它不像摄影那样是一种身体技能,但它本质上是从人工智能中捕捉图像自从阅读纽约时报的文章后,我也开始使用 Midjourney 来创建人工智能生成的图像。有时创作的图像是令人难以置信的作品,完全激发了我的灵感,但有时它们看起来有点平淡无奇。我在 Midjourney Discord 上看到其他人带有令人难以置信的长提示,这些提示精确地详细说明了他们在图像中想要的内容。我们都是学习如何使用相机的新摄影师,但在这种情况下,我们的工具是人工智能程序。这对我很有启发。我觉得我是最新技能现场的新手。我已经在 Fiverr 上看到一些艺术家提供他们的“即时工程”技能来策划图像。

在我玩 AI Midjourney 的几周里,我看到我设计提示的能力略有提高。 Midjourney discord 上甚至还有一个频道,供社区成员交流有关即时工程的知识。正是从这次聊天中,我了解到您可以专门告诉 Midjourney 从图像中删除某些内容。对于一张图片,我尝试了提示“ 山中的森林——阿尔 16:9 ”。 'ar' 参数指定纵横比为 16 x 9。输出如下所示:

Midjourney image using the prompt “forest in the mountains — ar 16:9”

使用否定参数,我能够从生成的图像中删除松树:

Midjourney image using the prompt “ forest in the mountains — ar 16:9 — no pines”

这是快速工程师如何使用 Midjourney 中可用的功能以及磨练他们的“艺术眼光”来创作新艺术品的一个小例子。

未来的提示工程会是什么样子?

随着人工智能的进步,我预计“即时工程”将继续发展。目前,有很多参数可以用来调整 Midjourney 上的图像——只要看看 文件 创作者提供的。通过结束参数,您可以指定纵横比、要使用的机器学习模型版本、照片的风格、对其他图像的任何权重等。未来的机器学习模型可能具有许多这些参数,可以将其与特征进行比较在相机上。艺术家需要掌握这些特征才能知道如何完善输出。

也许“即时工程”的方法将转向与 AI 助手交谈。我可以很容易地看到 Alexa 或 Google Assistant 有一个艺术引擎——只需对你的 Google Assistant 说出你想要的话,它就会创建图像。然后,您可以使用后续语音命令调整图像。也许谷歌助理甚至会问你是否喜欢这张图片。这些功能可能会降低提示工程师所需的“技能”,但它仍然是一种技能。同样,在 iPhone 上拍照也是一种技巧(当我们需要帮助时,我不会要求任何人为我和我的朋友拍照)。拍摄 iPhone 照片时有许多功能可以帮助您(自动对焦、人像模式等),但仍然只有那些具有“艺术之眼”的功能才能拍出好照片。同样,只有具有一定艺术感的人才能够在即时工程领域取得成功。

看看这个术语如何随时间变化也会很有趣。有朝一日,Prompt Engineering 将不仅仅指创建图像,还可以促使 AI 写论文、发送电子邮件,甚至写剧本(例如,“嘿谷歌,你能写一个混合电影《狐狸与猎犬》和《疯狂》的剧本吗? Max:Fury Road”,配乐包含听起来像 David Bowie 的新歌)。我们可能会使用个性化的人工智能引擎。 “嘿谷歌,用我的写作风格给我的老板发一封电子邮件,说我今天不能上班。” “嘿谷歌,用我以前的艺术作品来创造一个新的日落艺术,看起来就像我画的一样。”

如果人工智能程序继续看到足够的创新,也许有一天我们会看到工程师使用人工智能助手来创作新节目、新电影、新音乐、新书、新汽车设计或新城市规划设计。也许这个想法让你害怕,或者它激发了你。最后,这些 AI 工具旨在激励和提升艺术家,如果他们选择接受它的话。

正如 Chollet 所说,“关于艺术死亡的报道被大大夸大了。新工具不会扼杀艺术,而是扩展艺术。”摄影向我们展示了艺术家将继续适应新工具。提示工程是最新的工具;尽管——也许更因为——它出现在现场,艺术家们还是会茁壮成长。

Midjourney image using the prompt ”flowers and human forms in the style of matisse — ar 16:9 — test — creative”

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/37992/29171913

posted @ 2022-09-19 13:29  哈哈哈来了啊啊啊  阅读(217)  评论(0编辑  收藏  举报