读天才与算法:人脑与AI的数学思维笔记17_歌曲的创作公式
1. 人为何创作音乐
1.1. 音乐一直具有算法性质,这意味着在所有的艺术形式中,它受到人工智能进步的威胁最大
1.1.1. 音乐也是所有艺术形式中最抽象的一种,它利用结构和模式,而正是这种抽象的性质使它与数学紧密相连
1.1.2. 在这个世界里,算法将像人类一样得心应手
1.2. 音乐不仅仅是结构和模式而已,必须通过表演来赋予其生气
1.3. 对宗教仪式的需求是人类代码的一部分
1.3.1. 宗教仪式由一系列的活动组成,包括手势、言语和物品摆放,这些活动在一个神圣的地方按照固定的顺序或模式进行
1.3.2. 从外部来看,仪式似乎是非理性或不合逻辑的
1.3.3. 对内部来说,它提供了一种联系团队的重要方式
1.3.4. 随着文明的发展,音乐继续是仪式世界中的一部分
1.3.4.1. 从帕勒斯特里纳到巴赫再到莫扎特,音乐的巨大进步往往是在宗教背景下取得的
1.3.5. 随着我们内在意识的觉醒,“上帝”的概念将出现在人类身上
1.3.5.1. 随着意识的发展,意识到自己头脑中有一个声音,此时你会感到震惊
1.3.6. 宗教仪式和音乐可以安抚大脑中的声音,而自然的力量似乎是众神所为
1.4. 音乐是人与人之间交流的社会行为,是友谊的象征,是强大无敌的
1.4.1. 在德国发现的4万年前旧石器时代的笛子表明,我们的祖先可能能够进行远距离的交流
1.5. 在创造改变思维的仪式时,音乐是一个强有力的因素
1.5.1. 不断重复可以帮助改变我们的意识状态,正如许多萨满教仪式所证实的一样
1.5.2. 我们的大脑具有与不同的心理状态相对应的固有频率
1.5.2.1. 恍惚音乐充分利用了这个事实,即每分钟120拍的音乐最适合诱导人类产生幻觉体验
1.5.2.2. 混淆多种感官输入会导致大脑产生奇怪的灵魂出窍的体验
1.5.2.3. 触觉和视觉的组合可能使人产生肢体识别的障碍或假象
1.5.2.4. 我们经常能在发现早期的乐器时一同发现香料或草药,因为它们的组合既能给仪式带来一种气味(嗅觉),也能给仪式带来一种声音(听觉)
1.6. “吼板”
1.6.1. 吼板是一种自旧石器时代流传至今的古老发声器,在世界许多文化中都能找到其踪迹
1.6.2. 一臂长的坚硬木板被固定在一根长绳的末端,只要持有者将它甩过头顶并不断旋转,它就会发出一种360度环绕音响效果的轰鸣声,这会给持有者带来迷幻感,而声音可传至很远的地方
1.7. 算法已经学会了生成让我们感动的声音
1.7.1. Algoraves现在使用的算法可以对跳动的人群做出反应,帮助DJ策划舞曲和打碟
1.7.2. “深度巴赫”正在为教堂唱诗班创作更多的宗教合唱来歌颂上帝
1.7.3. 尽管这些算法似乎已经破解了音乐的代码,但是机器内部仍然是毫无波澜的
1.7.4. 这一切就像现代的数字“吼板”,它们仍然只是我们的工具而已
2. 创作公式
2.1. 音乐能言不能言,亦能言,不得不言
2.1.1. 维克多·雨果(Victor Hugo
2.2. 一首爵士乐会有一组标准的和弦,这些和弦会随着乐曲的演奏出现并变化
2.3. 小号手的任务是在变换和弦时吹奏一条与和弦相吻合的旋律线条
2.3.1. 他吹奏的旋律必然是一个音符到另一个音符,同时还要保证能组成旋律,所以演奏爵士乐就像在二维迷宫中描绘一条线一样
2.3.2. 和弦决定了垂直方向的动态,而他刚刚演奏的旋律决定了水平的动态
2.3.3. 随着爵士乐即兴成分的增加,音乐变得更自由,同时和声的发展也会变得更加流动,这就要求小号手必须能敏锐地觉察并预判钢琴手的发展意图,其发展的方向是由前面和声的发展决定的
2.4. 判断即兴演奏者水平的标准是,他是否会倾听并预判出主奏乐器的发展意图且配合得天衣无缝
2.5. 即兴爵士乐算法必须在实时交互中同时完成播放与对新材料的处理和响应
3. 爵士乐宝典
3.1. The Jazz Theory Book
3.2. 马克·列文(Mark Levine)所著的《爵士乐宝典》(The Jazz Theory Book)是许多青年音乐家初学时的经典用书
3.3. 列文经常和20世纪最伟大的即兴爵士乐演奏家迪兹·吉莱斯皮(Dizzy Gillespie)、弗雷迪·哈伯德(Freddie Hubbard)一起演奏
3.4. 一首伟大的爵士独奏是由1%的魔力和99%的可解释、可分析、可分类、可操作的东西组成的。
3.4.1. 马克·列文(Mark Levine)
3.4.2. 99%都是可以放进算法里的
4. 马尔可夫链
4.1. 在许多的算法中都可以看到马尔可夫链在起着重要的作用
4.1.1. 从模拟化学反应、经济趋势,到互联网导航,再到评估生物种群、人口动态
4.1.2. 俄国数学家安德烈·马尔可夫(Andrey Markov)选择检验自己理论的,不是科学,而是普希金的诗
4.2. 帕维尔·涅克拉索夫
4.2.1. 和马尔可夫的观点恰恰相反
4.2.2. 现实世界中的事物是相互依存的(比如人的行为),所以现实中的事物并不恰好符合数学模式或分布
4.2.3. 俄国的犯罪率统计是遵循大数定律的,但事实上,罪犯决定犯罪都是由个人意志决定的
4.3. 概率论的核心之一是“大数定律”
4.3.1. 概率论史上第一个极限定理属于伯努利
4.3.2. 这是概率论中讨论随机变量序列的算术平均值向随机变量各数学期望的算术平均值收敛的定律
4.3.2.1. 在随机事件的大量重复出现中,往往呈现几乎必然的规律
4.3.3. 如果你有一枚硬币,而每抛一次硬币都完全独立于上一次抛硬币,那么当你多次抛硬币时,正面和反面出现的次数之比就会越来越接近于一半对一半的比例
4.3.3.1. 抛掷硬币4次,全是正面的概率是1/16,但随着抛硬币次数的增加,偏离对半分概率的可能就会降低
4.3.4. 马尔可夫需要建立一个模型,在这个模型中,结果的概率取决于以前发生的事件,但长期来看仍然遵循大数定
4.3.4.1. 抛硬币的结果并不取决于以前抛硬币的结果,所以这不是马尔可夫理想的模型
4.4. 每个事件的概率仅取决于先前事件的一系列事件被称为马尔可夫链
4.4.1. 预测天气就是一个例子:明天的天气肯定取决于今天的天气,但并不特别依赖于上周的天气
4.4.1.1. 明天的天气只取决于今天的天气
4.4.2. 尽管每天的天气都依赖于前一天的天气,但从长远来看,无论我们的模型是从晴天、雨天还是阴天出发,下雨的概率都会趋向于相同的数值(32.35%)
4.4.3. 即使明天的天气依赖于今天的天气,长期的天气预报也与今天的天气无关
4.4.3.1. 通过数据我们可知,今天的天气是什么并不重要(即我们选择哪一行来观察),第十天的概率总是相同的
4.4.4. 从长期犯罪统计数据来看,罪犯决意犯罪是由个人自由意志决定的,这个论点是站不住脚的
4.5. 普希金(Pushkin)的《尤金·奥涅金》(Eugene Onegin)
4.5.1. 用它作为一个数据集来分析元音和辅音的出现概率
4.5.2. 马尔可夫提取了这首诗的前20 000个字母(大约占整首诗的1/8),计算了元音和辅音出现的次数
4.5.3. 一个辅音后面会跟着另一个辅音的概率是34%,而辅音后面会跟着一个元音的概率是66%
4.5.4. 尽管前几个字母在很大程度上取决于起始字母的选择,但是马尔可夫证明,从长远来看,字母的分布是一种模式
4.5.5. 即使是相互依赖的事件,如果它们受到固定概率的影响,也是一致的
4.6. 马尔可夫链的一个重要性质就是其是无记忆的
4.6.1. 在当前状态下,你可能需要一切可用的事件来预测下一个事件
4.6.2. 这种无记忆性也叫马尔可夫属性
5. 续作者
5.1. 第一个人工智能即兴爵士作曲演奏者
5.2. 弗朗索瓦·帕切特(François Pachet)
5.2.1. 在巴黎担任索尼计算机科学实验室(Sony Computer Science Laboratory)主任期间,帕切特发现人工智能领域的学习工具可以帮他完成作曲的梦想
5.2.2. 他使用概率论中的马尔可夫链公式写出了世界上第一首人工智能即兴爵士乐,并创造了世界上第一个可以进行爵士乐写作的算法
5.2.2.1. 对爵士音乐家的即兴演奏片段进行分析,给定一个音符,分析下一个音符出现的概率
5.2.3. 如果演奏一个特定的音符,那么下一个音符上行或是下行的概率都是50%
5.2.3.1. 基于这样的事实,该算法将在音阶上进行随机抓取
5.2.3.2. 给予算法的即兴演奏次数越多,它分析的数据就越多,某一种特定的演奏风格就会出现越多
5.2.3.3. 不希望算法生成与训练数据雷同的东西,所以回溯过多是没有好处的
5.2.4. 帕切特算法的优点是你可以向其提供实时数据
5.2.5. 这种问句和答句的形式在爵士乐中很常见,因此该算法可以和音乐家进行现场的旋律问答
5.2.5.1. 正因为该算法可以生成与训练数据相同风格的输出内容,所以被称为“续作者”
5.2.5.2. “续作者”会根据它刚刚演奏的内容以及训练数据,来计算下一个特定音符出现的概率,然后以掷骰子的随机模式做出选择
5.2.6. 在另一个版本的算法中,帕切特没有选择问句与答句的“问答模式”,而采用了一种“合作模式”
5.2.6.1. 算法会根据演奏的一段旋律,利用它的概率演算来推测出正确的伴奏和弦,就像真人在伴奏一样
5.3. 伯纳德·鲁巴特(Bernard Lubat)
5.3.1. 一位当代爵士音乐家
5.3.1.1. 对“续作者”进行了测试
5.3.2. 虽然它走在我前面,但毫无疑问它所发挥的一切的源头还是‘我’
5.3.3. “续作者”已经掌握了鲁巴特的音乐世界,但它不是简单地重复他以前做过的事情,而是在探索新的领域
5.3.3.1. 它是一个展示探索性创造力的算法
5.3.3.2. 它还通过向鲁巴特展示他以前从未接触过的方面,来促使其写出的作品更具创造性
5.3.4. 对于鲁巴特来说,这个算法生成的输出内容太有价值了:在算法帮助下,他的作品更具创造性,他也变得更富创造力了
5.3.5. 鲁巴特觉得在某种程度上他受到了身体的限制,而“续作者”却没有,这使得“续作者”有可能比他更有创造力
5.4. 这个算法生成的结果让编写算法的程序员和对算法进行训练的音乐家都感到惊讶,但它所带来的意义不仅仅是创新和令人惊讶而已
5.4.1. 人们都倾向于安于现状、故步自封
5.4.2. “续作者”已经开启了新的音乐世界的大门
5.4.3. 与人类相比,计算机能够更快地完成任务,处理更多的数据,但这一事实可能会导致人类创造力和人工智能创造力之间有趣的紧张关系
5.4.4. 也许在未来,“续作者”将生成只有另一台机器才能欣赏到的“声音”,因为它的复杂性和速度超出了人类的极限
5.5. “续作者”正在以有趣的方式,在体裁、样式、风格方面不断进行着突破
5.5.1. “续作者”的突破,完成了很多了不起的事情
5.6. 虽然它创作的音乐片段在局部是有意义的,甚至是相当令人惊喜的,但基于马尔可夫链系统存在的一些内在局限性,令它的作品最终还是不那么令人满意
5.6.1. 因为这些作品没有总体的全局结构,也就是并没有实现真正意义上的“作曲”