童话里都是骗人的?用词向量解析故事中的性别偏见
灰姑娘情结:等待王子拯救
灰姑娘情结,源于童话《灰姑娘》,故事中灰姑娘美丽善良,却无法改变自己的命运,只能等待王子的拯救。
其实,对性别的固有成见在现实社会中根深蒂固,文化产品的再创造仍然在不断强化这种偏见。
在这个研究中,作者分析了1,327部小说,6,657部电影大纲和1,109部电影剧本,揭示这些文化创作是如何以一种不易察觉但是强有力的方式来加深对性别的刻板印象。
“男人是女人通往幸福的道路”——这种偏见是如何通过一个精心设计的故事创造出来的?灰姑娘式的叙事结构形成并强化了"灰姑娘情结",即女性对独立的恐惧和被他人照顾的无意识欲望。"灰姑娘情结"在不同时期和不同文化中广泛存在,这提醒研究我们有必要通过教育、政策和其他方面创造新的叙述方式来与之作斗争。
词向量挖掘文本中的刻板印象
在近期的一篇预印本论文中,研究者提出了计算机化的框架分析,通过描绘故事的形状来测量性别刻板印象。
词嵌入技术提供了一个强大的替代情感词典的方法,首先,研究团队构建一个“高兴——不高兴”的情感轴,然后计算余弦相似性来得到每一个词的情感得分。
论文题目:
The Cinderella Complex: Word Embeddings Quantify Gender Stereotypes in Movies and Books
预印本地址:
https://arxiv.org/abs/1811.04599
采用词嵌入的方法,可以计算故事中每个句子的幸福指数,从而刻画故事中两个主要人物的情感起伏。图1展示了灰姑娘的案例。
在故事的开头,灰姑娘Ella和父母过着幸福的生活。她母亲的去世对应她第一次情感的下降。在那之后,继母和她的两个女儿走进了Ella的生活,她的父亲却在一次出差中去世,增加了她的不幸。在继母的虐待下,Ella的生活跌到了谷底。
当Ella在森林里遇到Kit(也就是王子)时,情况发生了变化,这给她的生活带来了一丝曙光。
在仙女教母的帮助下,Ella在舞会上再次遇到了Kit——就在这个时候,她的情感曲线达到了顶峰。离开舞会让她的生活再次坎坷,但与Kit的重逢使灰姑娘过上幸福的生活。
图1:《Cinderella(灰姑娘)》句子以垂直方式显示,文本颜色代表快乐(绿色)或不快乐(红色)。通过名字的突出显示,Ella(灰姑娘,橙色)和Kit(王子,蓝色)在同一个句子中同时出现。
图2:蓝色表示王子的情感起伏,黄色表示灰姑娘的情感起伏,灰色表示两人出现在同一场景。
研究团队用同样的方法分析了其他七千多个故事,得到了相同的结论,在相遇的时候,女性角色的幸福感增长显著高于男性角色。这些叙事背后揭示的,既是社会如何思考的结果,也是社会如何思考的原因。
人类对故事套路的偏好
人类是讲故事的动物。因为故事是功能性的——它们是有道德判断的。
纵观历史,故事不仅用来娱乐听众,还用来指导听众如何表演和期待什么。伊索寓言可能是最著名的道德故事的展示。即使作者不在了,这些寓言还是在不同的文化和时期一遍又一遍地传播着同样的人生经验。
故事的功能决定了它们的形式和命运。电影、书籍、电视节目、新闻,不管它们采取什么形式,依靠什么媒体生存,只有那些与它们所属时代的现有规范和价值观相一致的故事才能生存和繁荣。
从这个角度来看,这些故事在许多方面都与生物体相似,这些心灵生物被创造、交流和记忆的社会过程,作为一种选择和进化它们形状的适应功能。
根据"适者生存"原则,研究团队认为,故事遵循"最刻板印象的生存"原则,这一原则迫使故事减少从文化和社会生活中抽取的复杂性,并简化成令人难忘的、典型的刻板印象描述,这有助于它们在有限的集体记忆中生存。
跌宕起伏的戏剧形象,扁平化的人物,简单化的原因,所有这些技巧使故事更容易被接受、复述和联系起来,从而增加了故事在社会中的适应性,也增加了成为文化基因的可能性。然而,这些技巧也使故事成为社会生活中固有观念的主要来源之一。
所以灰姑娘情结的广泛存在实际是因为人们喜欢这种叙事结构。为了检验这一假设,研究团队运用OLS线性回归来探讨女性或男性角色相遇时候的情绪增长,如何影响电影的受欢迎程度(以投票数量衡量)和质量(以评分衡量)。
研究团队观察到,与男性角色同时出现的女性幸福感的增加对受欢迎程度和质量有正向影响,而男性幸福感的增加则有负向影响。
这一发现揭示了一个惊人的事实:表现女性情感脆弱和依赖的电影更有可能被认为是一个"好故事"(高评分),并且会得到更多的关注(更多的投票)。相比之下,关于男性角色情感脆弱的电影是不受欢迎的。
电影数据揭开男女差异
生活总是复杂的,即使对于故事中那些扁平的、老套的人物来说也是如此。为了揭示女性角色对男性角色情感依赖的构建背景,研究团队将电影大纲数据分为女性和男性两组。
对于每一组,研究团队选择人物共现前和后的L个词,通过迭代所得到的2L词序列中的词来构建词的共现网络。
图3: 女性为主电影的词共现网络。a使用Q-modularity识别出来的三个社区。b,c,d分别是形容词、动词和名词的分布。
图3显示了女性词汇网络中的三种类型,包括家庭、爱情和动作。而对于男性词汇网络图4来说,还有另外两个类型,职业和犯罪,这意味着男性角色的生活更加多样化,爱情关系和家庭义务则导向女性。
图4: 男性为主电影的词共现网络。a使用Q-modularity识别出来的五个社区。b,c,d分别是形容词、动词和名词的分布。
为了更好地比较男性和女性系统的语义结构,研究团队将网络切割成形容词、动词和名词。词语分布的差异为理解性别陈规定型观念提供了一个新的维度。
特别是男性网络中的动词占比大于女性网络中的动词占比。例如,在女性身上,网络中的"丈夫"是家庭社区中的高度节点,而在男性网络中,"妻子"在同一层次上并不重要。
故事是现实的镜子
这项研究揭示了灰姑娘情结在故事中的广泛存在——女性人物对男性人物的情感依赖。研究团队的分析从解剖灰姑娘的电影大纲开始,然后扩展到7000个电影和书籍。
运用词嵌入技术,研究团队展示了一个性别刻板印象——男人是女人通往幸福的道路——是如何通过一个精心设计的故事形式被构建和传递的。对许多人来说,很难想象灰姑娘情结这样的陈词滥调仍然广泛存在于研究团队的流行文化中。
故事是现实的镜子,它们的结构反映了我们的文化和集体记忆是如何建立、增强和发展的。只有事件和人的复杂性被减少和压缩,这样才有可能在集体记忆中代代相传。
参考文献:
-
Xu H, Zhang Z, Wu L, Wang C_J. The Cinderella Complex: Word Embeddings Quantify Gender Stereotypes in Movies and Books. Available from https://arxiv.org/abs/1811.04599. 2019.06.
-
Caliskan A, Bryson JJ, Narayanan A. Semantics derived automatically from language corpora contain human-like biases. Science. 2017;356: 183–186.
-
Garg N, Schiebinger L, Jurafsky D, Zou J. Word embeddings quantify 100 years of gender and ethnic stereotypes . Proceedings of the National Academy of Sciences. 2018. pp. E3635–E3644. doi:10.1073/pnas.1720347115
-
Dowling C. The Cinderella Complex: Women’s Hidden Fear of Independence. 1982.
-