你知道AI无法通过阅读一本好书获得灵感,对吧?

你知道AI无法通过阅读一本好书获得灵感,对吧?

人类写故事的方式和AI生成文本的方式是天差地别,完全无法相提并论。

                                                          男孩与怪物的水彩画插图,授权自Deposit Photos

有人曾这样问我:如果他们读了托尔金的所有书,然后写了一本关于精灵和霍比特人的书,这算盗窃吗?我笑了。

不,当然不是。

你知道这个问题的由来吧?

这是一种时代产物,因为AI的缘故。

这是人们在不了解AI和大型语言模型如何运作时会提出的问题。当他们听说著名作家在起诉OpenAI使用他们的作品时,却不太明白原因所在。

因为人类也这么做,不是吗?自古以来,人类阅读书籍、受到启发,然后基于让他们获得灵感的作品写出自己的故事。

C.S.刘易斯深受奇幻作家乔治·麦克唐纳、托尔金的作品、G.K.切斯特顿和威廉·华兹华斯的启发。他读了那些书,构思出了纳尼亚。完全没问题。

那么,为什么AI就不一样呢?

这正是人们不明白的地方。

另一个更尖锐的问题:

如果J.K.罗琳读了几十本(有版权的)奇幻书籍,然后创作了自己的书,并从其他作者的想法中汲取灵感,靠她的书赚了数十亿,为什么没有人起诉她侵犯版权?

规模不同,但概念是一样的。

问题在于,不仅仅是规模不同,概念也完全不同。差距非常大,甚至根本不沾边。

人类阅读、获得灵感并写故事的方式,与AI的工作方式是天差地别的。两者完全无法相提并论。这种对比可以理解,但从根本上是错误的。

让我来给你展示一下。

人类如何通过阅读获得灵感:

我在森林里散步时突然有了一个写故事的点子:一个有魔法能力的孩子。因为我刚读完《哈利·波特》。当然没读过,但假设是这样。我的主角会是一个女孩,但她是十五岁,而不是十二岁。因为现在YA(青少年)小说很火。

故事里必须有一个睿智且充满魔法的角色,因为我喜欢纳尼亚中的阿斯兰。天啊,那段与雪后女王的场景,太棒了吧?不过我的睿智角色会是一条龙。你可以说我疯了,但我想写关于龙的故事。

还有,必须得有谜语。我喜欢托尔金作品里的谜语。但是,谜语不会是反派用来阻止主角的工具,而是龙来说谜语。像尤达一样,这样多有趣!我会把女孩取名为莎拉,当她解开这些谜语时,她会拯救世界。

她要拯救世界免于什么?我需要再琢磨一下。也许可以从我喜欢的其他书或者电影中借鉴灵感,谁知道呢。

这就是人类获取灵感的方式。

我可以从我读过的书中一些细节中“获得灵感”,当然可以。但我仍然需要把这些细节连贯起来,创造一个情节,写出场景,确保它有趣且引人入胜,节奏良好,每个角色都生动饱满,而不是扁平无趣。

实际上,当你真的动手去写时,你会发现这比你想象的要难得多。

当我完成后,只要我把它以某种形式记录下来,比如打印在纸上,或者上传到网上,我就拥有了它的版权。

版权保护的是什么?

版权保护的不是我写下单词的排列顺序。因为如果版权只保护单词的排列顺序,人们完全可以通过重新排列单词来规避版权。

作家在写作过程中必须做出创造性的选择。这才是版权实际保护的对象——作家在创作过程中做出的创造性选择。

一旦我拥有了版权,这意味着什么呢?这意味着我可以决定谁可以通过我的作品获利。我可以允许别人从我的作品中获利。我可以告诉米高梅公司:“可以拍电影,但收益分成要按我说的来。”但他们得先征得我的同意。

使用我的作品的许可是我的法律权利。这就是版权的意义所在。

AI是如何“创作”文本的?

来看这个例子:

(一段关于《霍比特人》的ChatGPT对话,作者截图)

人类并没有这样的记忆力,但我们也不需要。

我不需要有摄影式的记忆去回忆起《霍比特人》或《纳尼亚》里那些让我感动的特定场景。我不需要这样的记忆力去记住雪后女王、阿斯兰或者霍比特人。

我阅读,记住一些片段,然后它们激发我产生自己的想法。

AI并不是这样“阅读”的。它会完整地“保存”。它必须这么做。

大多数人并不了解AI和大型语言模型(LLM)是如何工作的。他们以为它在模仿我们做的事。因为“语言”有时是很狡猾的,当技术人员谈到“训练”AI时,我们会认为AI是在被训练、被学习。

我们会把它想成是训练一只狗坐下,或者教一个孩子如何握笔、如何造句,比如“跑,杰克,跑。”

但事实完全不是这么回事。

Simon Willison 是一位程序员,他写了一篇文章解释像ChatGPT、Google Bard和Llama 2这样的大型语言模型是如何工作的。

简单来说,它们以某种类似于iPhone键盘的方式“猜测”下一个词应该是什么,但规模大得多。AI只是在做概率生成。根据它保存的所有单词,预测下一个应该是什么单词。

不是“阅读”。而是“保存”。

“训练”是怎么回事呢?那只是程序员在告诉它“不能做什么”。

比如,当《纽约时报》起诉说ChatGPT可以吐出他们的文章,而这些文章是需要付费墙访问的。于是,程序员“训练”AI不要这么做,通过制定规则:不能从任何一个来源中吐出超过“X”个字。

这就是“训练”的意义。不是学习,而是为输出设置规则。

AI并没有学习任何东西。从它被发布时是一个概率生成器,到现在,它仍然是一个概率生成器。他们只是在不断给它喂更多的单词,提供更多可以用来参考的内容。但它的工作原理始终没有改变。

AI完整保存内容是因为它必须这么做。这样它才可以在有人输入提示时,从中调取优质的文字。

所以,如果你让ChatGPT写一篇关于龙的故事,它会扫描所有关于龙的书籍和故事,从中挑选出词汇和短语。如果你让它写一个关于患癌症的女性的故事,它也会这么做。所有这些被调取的文字都是别人写的。而他们并没有被征求许可或获得报酬。

人类是“阅读”和“启发”,机器人是“保存”和“调取”。

做一个人类有趣的一点是,我们通常无法理解那些我们没有参照框架的东西。我的小侄女每天走路去上学,从不担心会有一个成年男人因为她在受教育而向她脸上泼酸。然而,在世界的某些地方,这种事确实发生。

很多人不理解AI的问题是什么。

主要是因为他们不了解外面的世界正在发生什么。

大多数人使用AI工具,如ChatGPT、Bard或Llama2,通常是很无害的。

比如用于产生创意、改进写作建议或检查语法。他们用AI来写更好的标题。甚至我自己也写过一篇关于如何使用AI帮助你把糟糕的标题变成好标题的文章。

如果我为客户写文案,ChatGPT是个很好的工具。我可以登录,问它某个话题或产品的十大常见问题。

但不是所有人都以这样单纯的方式使用它。远远不是。并非所有人都有同样的动机或道德观。

再来看另一个例子:

                                                                      (一段ChatGPT对话的截图,作者提供)

这一点,正是为什么玛格丽特·阿特伍德会成为八千多位作家中要求OpenAI赔偿的其中之一。

过去一年的新闻媒体一直在报道AI的恶意使用。一遍又一遍。以下是五个这样的标题:

• 骗人的AI生成书籍泛滥亚马逊

• AI生成的盗版作品充斥亚马逊

• 带有AI生成假评论的ChatGPT书籍充斥亚马逊

• AI生成的书籍泛滥Kindle Unlimited

• AI写的书籍涌入亚马逊

我向你保证,这五篇文章只是冰山一角。

搜索诸如“AI书籍”、“AI盗版”以及“AI重写”的短语,你会找到令人瞠目结舌的内容。你能想象作为詹姆斯·帕特森、苏珊·柯林斯或玛格丽特·阿特伍德,发现“重写版”的自己书籍在亚马逊上出售是什么感觉吗?

生活变成了一场“打地鼠”的游戏:每天不断地找这些盗版书。

最终,你不得不放弃。因为这太多了。

亚马逊声称他们“在努力帮助”,他们修改了规则。现在,作家每天只能上传三本书。我希望我是在开玩笑,但我不是。我真想知道哪个人类一天能写三本书。我认识的任何人类都做不到。只有那些使用AI批量生产书籍的人能做到。

记住,版权赋予作家的是什么?

法律上决定谁能从你的作品中获利的权利。

你觉得那八千位作家是否还能决定谁能从他们的作品中获利?因为我向你保证,当ChatGPT在未经许可的情况下扫描他们的书籍时,他们就已经失去了这种权利。没有许可,没有补偿。

这和人类读一本书然后获得灵感完全不同。

关键是——大多数付费使用AI的人,并不是为了盗用玛格丽特·阿特伍德或詹姆斯·帕特森的书籍。他们是少数。尽管这种情况太多了,但一个都已经太多了。

事实上,大多数人使用AI是因为他们认为它写得比他们好,或者写得更快,或者两者兼而有之。

他们打开ChatGPT,输入提示,让它写点东西。比如:“告诉我冥想的好处,用500个字。”或者让它写一个关于散步迷路的故事,或者让它写诗。

不仅仅是ChatGPT,还有其他网站也能这么做。

比如我曾写过的一个网站,叫Ghost Writer,它能以托尔斯泰、狄更斯、福克纳、爱伦·坡、斯坦贝克、陀思妥耶夫斯基等作家的风格写作。还有简·奥斯汀、玛丽·雪莱、艾米莉·狄金森、夏洛特·勃朗特和弗吉尼亚·伍尔夫等更多作家。

这个网站的界面设计得很有趣,把这些作家设计得像“亡灵”一样。很有趣,你可以给托尔斯泰、狄更斯和坡相同的提示,看看他们的写作风格有何不同。这完全合法。你知道为什么吗?因为这些作家都已经去世,他们的作品已经进入公共领域。因此,这个网站可以合法地从中获利。

那么,这样对约翰·格里沙姆、乔治·R.R.·马丁、朱迪·皮考特、乔治·桑德斯、詹姆斯·帕特森、玛格丽特·阿特伍德等仍然在世的作家是否合法呢?

这样对《纽约时报》、《纽约每日新闻》、《芝加哥论坛报》、《丹佛邮报》、《水星新闻》、《橙县纪事报》和《奥兰多哨兵报》等媒体是否合法呢?因为这些机构都在提起诉讼。

围观这些法律战斗,就像在看古罗马或希腊众神的战争,而凡人只能战战兢兢地旁观。

因为这些案件是由地球上最富有的人在法庭上互相较量。我不知道谁会赢。我不知道他们会不会修改版权法来偏向有钱人。但直到版权法被改写之前,版权持有者仍然拥有决定谁可以从他们的作品中获利的法律权利。

但无论版权法是否会改变,AI的工作方式根本不是人类的工作方式。完全不同。天差地别。机器人是通过保存文本,然后用概率生成器从保存的所有文字中拼凑出新文本。

只有人类才能真正创造。

posted @   果冻人工智能  阅读(16)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示