你知道AI无法通过阅读一本好书获得灵感，对吧？

人类写故事的方式和AI生成文本的方式是天差地别，完全无法相提并论。

                                                          男孩与怪物的水彩画插图，授权自Deposit Photos

有人曾这样问我：如果他们读了托尔金的所有书，然后写了一本关于精灵和霍比特人的书，这算盗窃吗？我笑了。

不，当然不是。

你知道这个问题的由来吧？

这是一种时代产物，因为AI的缘故。

这是人们在不了解AI和大型语言模型如何运作时会提出的问题。当他们听说著名作家在起诉OpenAI使用他们的作品时，却不太明白原因所在。

因为人类也这么做，不是吗？自古以来，人类阅读书籍、受到启发，然后基于让他们获得灵感的作品写出自己的故事。

C.S.刘易斯深受奇幻作家乔治·麦克唐纳、托尔金的作品、G.K.切斯特顿和威廉·华兹华斯的启发。他读了那些书，构思出了纳尼亚。完全没问题。

那么，为什么AI就不一样呢？

这正是人们不明白的地方。

另一个更尖锐的问题：

如果J.K.罗琳读了几十本（有版权的）奇幻书籍，然后创作了自己的书，并从其他作者的想法中汲取灵感，靠她的书赚了数十亿，为什么没有人起诉她侵犯版权？

规模不同，但概念是一样的。

问题在于，不仅仅是规模不同，概念也完全不同。差距非常大，甚至根本不沾边。

人类阅读、获得灵感并写故事的方式，与AI的工作方式是天差地别的。两者完全无法相提并论。这种对比可以理解，但从根本上是错误的。

让我来给你展示一下。

人类如何通过阅读获得灵感：

我在森林里散步时突然有了一个写故事的点子：一个有魔法能力的孩子。因为我刚读完《哈利·波特》。当然没读过，但假设是这样。我的主角会是一个女孩，但她是十五岁，而不是十二岁。因为现在YA（青少年）小说很火。

故事里必须有一个睿智且充满魔法的角色，因为我喜欢纳尼亚中的阿斯兰。天啊，那段与雪后女王的场景，太棒了吧？不过我的睿智角色会是一条龙。你可以说我疯了，但我想写关于龙的故事。

还有，必须得有谜语。我喜欢托尔金作品里的谜语。但是，谜语不会是反派用来阻止主角的工具，而是龙来说谜语。像尤达一样，这样多有趣！我会把女孩取名为莎拉，当她解开这些谜语时，她会拯救世界。

她要拯救世界免于什么？我需要再琢磨一下。也许可以从我喜欢的其他书或者电影中借鉴灵感，谁知道呢。

这就是人类获取灵感的方式。

我可以从我读过的书中一些细节中“获得灵感”，当然可以。但我仍然需要把这些细节连贯起来，创造一个情节，写出场景，确保它有趣且引人入胜，节奏良好，每个角色都生动饱满，而不是扁平无趣。

实际上，当你真的动手去写时，你会发现这比你想象的要难得多。

当我完成后，只要我把它以某种形式记录下来，比如打印在纸上，或者上传到网上，我就拥有了它的版权。

版权保护的是什么？

版权保护的不是我写下单词的排列顺序。因为如果版权只保护单词的排列顺序，人们完全可以通过重新排列单词来规避版权。

作家在写作过程中必须做出创造性的选择。这才是版权实际保护的对象——作家在创作过程中做出的创造性选择。

一旦我拥有了版权，这意味着什么呢？这意味着我可以决定谁可以通过我的作品获利。我可以允许别人从我的作品中获利。我可以告诉米高梅公司：“可以拍电影，但收益分成要按我说的来。”但他们得先征得我的同意。

使用我的作品的许可是我的法律权利。这就是版权的意义所在。

AI是如何“创作”文本的？

来看这个例子：

（一段关于《霍比特人》的ChatGPT对话，作者截图）

人类并没有这样的记忆力，但我们也不需要。

我不需要有摄影式的记忆去回忆起《霍比特人》或《纳尼亚》里那些让我感动的特定场景。我不需要这样的记忆力去记住雪后女王、阿斯兰或者霍比特人。

我阅读，记住一些片段，然后它们激发我产生自己的想法。

AI并不是这样“阅读”的。它会完整地“保存”。它必须这么做。

大多数人并不了解AI和大型语言模型（LLM）是如何工作的。他们以为它在模仿我们做的事。因为“语言”有时是很狡猾的，当技术人员谈到“训练”AI时，我们会认为AI是在被训练、被学习。

我们会把它想成是训练一只狗坐下，或者教一个孩子如何握笔、如何造句，比如“跑，杰克，跑。”

但事实完全不是这么回事。

Simon Willison 是一位程序员，他写了一篇文章解释像ChatGPT、Google Bard和Llama 2这样的大型语言模型是如何工作的。

简单来说，它们以某种类似于iPhone键盘的方式“猜测”下一个词应该是什么，但规模大得多。AI只是在做概率生成。根据它保存的所有单词，预测下一个应该是什么单词。

不是“阅读”。而是“保存”。

“训练”是怎么回事呢？那只是程序员在告诉它“不能做什么”。

比如，当《纽约时报》起诉说ChatGPT可以吐出他们的文章，而这些文章是需要付费墙访问的。于是，程序员“训练”AI不要这么做，通过制定规则：不能从任何一个来源中吐出超过“X”个字。

这就是“训练”的意义。不是学习，而是为输出设置规则。

AI并没有学习任何东西。从它被发布时是一个概率生成器，到现在，它仍然是一个概率生成器。他们只是在不断给它喂更多的单词，提供更多可以用来参考的内容。但它的工作原理始终没有改变。

AI完整保存内容是因为它必须这么做。这样它才可以在有人输入提示时，从中调取优质的文字。

所以，如果你让ChatGPT写一篇关于龙的故事，它会扫描所有关于龙的书籍和故事，从中挑选出词汇和短语。如果你让它写一个关于患癌症的女性的故事，它也会这么做。所有这些被调取的文字都是别人写的。而他们并没有被征求许可或获得报酬。

人类是“阅读”和“启发”，机器人是“保存”和“调取”。

做一个人类有趣的一点是，我们通常无法理解那些我们没有参照框架的东西。我的小侄女每天走路去上学，从不担心会有一个成年男人因为她在受教育而向她脸上泼酸。然而，在世界的某些地方，这种事确实发生。

很多人不理解AI的问题是什么。

主要是因为他们不了解外面的世界正在发生什么。

大多数人使用AI工具，如ChatGPT、Bard或Llama2，通常是很无害的。

比如用于产生创意、改进写作建议或检查语法。他们用AI来写更好的标题。甚至我自己也写过一篇关于如何使用AI帮助你把糟糕的标题变成好标题的文章。

如果我为客户写文案，ChatGPT是个很好的工具。我可以登录，问它某个话题或产品的十大常见问题。

但不是所有人都以这样单纯的方式使用它。远远不是。并非所有人都有同样的动机或道德观。

再来看另一个例子：

                                                                      （一段ChatGPT对话的截图，作者提供）

这一点，正是为什么玛格丽特·阿特伍德会成为八千多位作家中要求OpenAI赔偿的其中之一。

过去一年的新闻媒体一直在报道AI的恶意使用。一遍又一遍。以下是五个这样的标题：

• 骗人的AI生成书籍泛滥亚马逊

• AI生成的盗版作品充斥亚马逊

• 带有AI生成假评论的ChatGPT书籍充斥亚马逊

• AI生成的书籍泛滥Kindle Unlimited

• AI写的书籍涌入亚马逊

我向你保证，这五篇文章只是冰山一角。

搜索诸如“AI书籍”、“AI盗版”以及“AI重写”的短语，你会找到令人瞠目结舌的内容。你能想象作为詹姆斯·帕特森、苏珊·柯林斯或玛格丽特·阿特伍德，发现“重写版”的自己书籍在亚马逊上出售是什么感觉吗？

生活变成了一场“打地鼠”的游戏：每天不断地找这些盗版书。

最终，你不得不放弃。因为这太多了。

亚马逊声称他们“在努力帮助”，他们修改了规则。现在，作家每天只能上传三本书。我希望我是在开玩笑，但我不是。我真想知道哪个人类一天能写三本书。我认识的任何人类都做不到。只有那些使用AI批量生产书籍的人能做到。

记住，版权赋予作家的是什么？

法律上决定谁能从你的作品中获利的权利。

你觉得那八千位作家是否还能决定谁能从他们的作品中获利？因为我向你保证，当ChatGPT在未经许可的情况下扫描他们的书籍时，他们就已经失去了这种权利。没有许可，没有补偿。

这和人类读一本书然后获得灵感完全不同。

关键是——大多数付费使用AI的人，并不是为了盗用玛格丽特·阿特伍德或詹姆斯·帕特森的书籍。他们是少数。尽管这种情况太多了，但一个都已经太多了。

事实上，大多数人使用AI是因为他们认为它写得比他们好，或者写得更快，或者两者兼而有之。

他们打开ChatGPT，输入提示，让它写点东西。比如：“告诉我冥想的好处，用500个字。”或者让它写一个关于散步迷路的故事，或者让它写诗。

不仅仅是ChatGPT，还有其他网站也能这么做。

比如我曾写过的一个网站，叫Ghost Writer，它能以托尔斯泰、狄更斯、福克纳、爱伦·坡、斯坦贝克、陀思妥耶夫斯基等作家的风格写作。还有简·奥斯汀、玛丽·雪莱、艾米莉·狄金森、夏洛特·勃朗特和弗吉尼亚·伍尔夫等更多作家。

这个网站的界面设计得很有趣，把这些作家设计得像“亡灵”一样。很有趣，你可以给托尔斯泰、狄更斯和坡相同的提示，看看他们的写作风格有何不同。这完全合法。你知道为什么吗？因为这些作家都已经去世，他们的作品已经进入公共领域。因此，这个网站可以合法地从中获利。

那么，这样对约翰·格里沙姆、乔治·R.R.·马丁、朱迪·皮考特、乔治·桑德斯、詹姆斯·帕特森、玛格丽特·阿特伍德等仍然在世的作家是否合法呢？

这样对《纽约时报》、《纽约每日新闻》、《芝加哥论坛报》、《丹佛邮报》、《水星新闻》、《橙县纪事报》和《奥兰多哨兵报》等媒体是否合法呢？因为这些机构都在提起诉讼。

围观这些法律战斗，就像在看古罗马或希腊众神的战争，而凡人只能战战兢兢地旁观。

因为这些案件是由地球上最富有的人在法庭上互相较量。我不知道谁会赢。我不知道他们会不会修改版权法来偏向有钱人。但直到版权法被改写之前，版权持有者仍然拥有决定谁可以从他们的作品中获利的法律权利。

但无论版权法是否会改变，AI的工作方式根本不是人类的工作方式。完全不同。天差地别。机器人是通过保存文本，然后用概率生成器从保存的所有文字中拼凑出新文本。

只有人类才能真正创造。

posted @ 2025-01-26 11:04 果冻人工智能阅读(16) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

公告

昵称：果冻人工智能
园龄： 4个月
粉丝： 38
关注： 1

2025年2月

日

一

二

三

四

五

六

你知道AI无法通过阅读一本好书获得灵感，对吧？

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论