惩罚与奖励系统

2330044065_03682e251a

在日常生活中有许多选择。起床跳下床,或再在睡一会?吃鸡肉还是牛肉,蔬菜?做作业,还是和朋友出去玩?这些选择和动作,是你拿来绘制你的每一天,每一周,以及整个人生的不同色彩。正是通过这些选择,你可以体验世界,表达自己。

如果生活是一场游戏,这些你选择做的动作是生活中的基本机制。它们是你可以做的动作(你有能力去做),而且你可以选择不去做。他们是你自己对游戏系统的输入。你可以根据个人喜好自由选择你拥有的技能并且施放。

……真是这样吗?嗯,不止这些。你的行为和意志不是那么自由。是的,你是有要做的决定,可以做,但是也会有后果,有要求和附加条件。你可能有能力在图书馆里面尽全力大喊。你可能有能力侮辱你的好朋友获胜抢劫一家便利店。你可能有能力坐在公寓里面,而不是和朋友出去享受周末。

你可以做这些事,但是你应该不会。即使你有能力和手段,还是有别的东西指引你的决定。还会有更多这种所谓的“决定”会让你想不到。就好象一些无形的力量在管理你的行动。

 

自由意识?或者不是那么自由?

每个游戏都有让玩家进行的动作(基本机制)。玩家可以跑,射击,涂画,扔东西,吃,传送,或者别的什么。但是这些行动不是孤立的,有一个更高层的规则在控制它们。这些惩罚和奖励规则让玩家更偏向于某些行为。它给了基本机制意义和权重,迫使玩家去思考自己的选择。

因此,理解惩罚和奖励系统是理解人类行为的问题。在任何指定时刻,人有许多动作可以做,最通常的行为只占那些动作中的很小的百分比。其原因是,正如我们所说,游戏让他们的动作和结果联系起来。在生活和游戏中,人很学会从过去经历得到经验,然后从中选择选择一个他们想要的后果,再选择相应的动作。这些动作和后果组成了控制玩家行为的惩罚与奖励系统(P&R系统)。

 

supermario

在《超级玛丽奥64》里,玩家的基本机制可以让他们在游戏世界里跑和跳(忽略道具)。如何使用这些技能在世界中收集星星来完成关卡,这取决于玩家的决定。

但是,玩家控制玛丽奥的时候,动作是被P&R系统限制的。如果玛丽奥被敌人碰到,他会倒在地上而且掉血。这是一个惩罚的简单例子,而且我们可以以分析他是如何影响玩家的行为的。一旦玩家明白直接撞到敌人会掉血,他们的行为会改变。

从技术上讲,玩家确实可以选择直接冲向敌人。然而游戏的P&R系统告诉他们,这是应该避免的。因此玩家控制玛丽奥避开敌人。

 

游戏并没有改变,同样的基本机制,它们仍只是奔跑和跳跃。但玩家使用这些基本机制的方式已经改变了。之后玩家了解到游戏鼓励他们做的事情,他们做的决定发生变化。

随着玩家和游戏及其P&R系统交互,他们开始在他们脑中建立起一个心理模型,心理模型关于游戏如何工作,他们如何控玛丽奥制最佳。开发人员是否想让玩家充分了解游戏系统是开发人员的事情,但是P&R系统的作用是唤起期望的玩家行为。一个好的设计能够预计出期望的玩家行为,然后再根据设计建立一个P&R系统会鼓励这些行为。

 

种下策略种子

玛丽奥和敌人就是一个明显的例子,但是有时候P&R系统的效果是更加潜在的。

让我们以流行的塔防游戏作为例子。在这些游戏中,玩家需要保证有防御塔,把从屏幕另一边进攻的敌人挡住。这些塔走过的敌人,而且敌人也会试图寻找最短的路。

 

在这些游戏中,基本机制是:

  • 决定造那种塔
  • 决定在什么地方造塔

 

这些都是玩家他们面临的选择,他们可以任意选择吗?从技术上讲,玩家可以随便摆任何任何类型的塔,但是他们肯可能会输。游戏的P&R系统将鼓励某些行为。所以实际上,玩家只能以游戏设计期望的方式使用机制。

例如,玩家可以在右上角放一个塔,远离其他任何东西,但是P&R系统不会鼓励这个动作。敌人不会受到攻击,他们基本上会达成他们的目标,导致玩家输了。最终玩家将学到最佳选择是在中间放一个塔,理想情况会把敌人挡住。当然玩家可以继续在角落里放塔,失败,再来一次,但是这回很快让玩家觉得无聊。

DTD1-300x212对比

DTD2-300x212

这也是一个限制玩家行为的P&R系统的例子。游戏给玩家一些可以做的动作,但是系统中隐藏的是一个让玩家胜利的最佳策略。

 

P&R系统的基本规则

下面的图表示P&R系统如何影响玩家的行为:

PAndR

 

通过基本机制,开发人员决定给玩家什么动作可供选择。然后,开发人员构建P&R系统,用一个“漏斗”限制玩家可能做出的决定,得到期望的玩家行为。

 

那么,如何构建一个这样有趣的“漏斗”?要回答这个问题,我们需要看一看对游戏设计有重大影响的东西之一:行为主义心理学。由研究人员BF Skinner等指引,行为,特别是操作制约,是一种观察研究目标的行为和系统回应的方式。

 

听起来耳熟?操作制约是基础研究领域,它和我们讨论游戏的关系紧密。同样,P&R系统有四种主要影响玩家行为的方式:

1. 正面奖励 —— 奖励玩家的行为。通过给他们一些他们想要或喜欢的东西

2. 反面奖励 —— 通过带走一些玩家不喜欢的东西

3. 正面处罚 —— 奖励玩家一些他们不喜欢的东西

4. 反面处罚 —— 带走一些玩家想要或者喜欢的东西

 

通过捆绑P&R系统到玩家对游戏基础机制的用法上。游戏开发人员塑造了玩家对游戏基础机制的用法。例如在《超级马里奥64》中,当玩家击败了敌人koopa troopa时,玩家通常会得到一枚金币,这是玩家想得到的。这是一个正面奖励的例子。此外,敌人Goomba现在已经不复存在了,这是一个消极奖励的例子,因为关卡中的会伤害你的敌人变少了。

 

对于P&R系统的处罚方面,如果玛丽奥碰到岩浆,他会跑来跑去,玩家无法控制,试图扑灭身上的火。这跑来跑去是正面处罚的例子,给玩家施加他们不想要的行为 —— 他们想要控制玛丽奥,而不是让他疯狂乱跑。此外,玛丽奥也会掉一些血,这是一个反面处罚的例子,因为玩家想要血条里有更多的生命值。

 

指引玩家的行为

一个从由几个简单机制组成的游戏到一大堆机制的游戏,甚至更多,游戏自身的复杂度会带来很多小时的游戏体验,然后P&R系统也会变得相当复杂。因此,最好要有一个对构建一个P&R系统的基本策略的认识。

 

一切都开始与游戏的核心体验。一旦你的游戏的核心体验被确定,你就可以开始考虑机制,从而导向你期望的玩家行为。考虑下面这些一般原则:

做第一个猜测。一个好的P&R系统是间接设计的。大多数开发人员关注于他们想要的行为,他们把系统设置好,但是关注于系统本身可以导致玩家困惑。因此先想好你想让玩家做什么,详细描述它。然后设置惩罚和奖励制度,鼓励这种行为。试着以玩家身份想一想,他们会做什么。

轻微的变化和调整。如果你所设计的系统没有让玩家做你想要的行为,那么你可以调整它。你能想象到(或者看到,如果你在做原型的话)玩家总是撞到墙上,但是你希望玩们在关卡中飞舞?那么你可以创造一个碰到墙上的小处罚。小的变化可以让家的行为有很大变化。

为反馈定时。另一个重要的方面是要思考P&R系统的反馈到达玩家那里要花多长时间。时间是你决定的,但是它是完全基于你如何希望玩家学习你的系统的。在大多数游戏,像超级马里奥,反馈是即时的。“我摔下悬崖,游戏告诉我,我死了。好的,知道了。这是不好的,下一次注意别摔下悬崖。”

 

但是,在其他游戏里面,通过不让P&R系统即使反馈增加了复杂性。像在策略游戏《星际争霸中》,玩家掌握游戏策略要花更长的时间,因为胜利和失败的反馈一开始不会容易看出来,知道最后快被灭的时候才清楚。玩家可以在一个难以防守的地方建立一个基地,这个选择可能会让玩家一个小时之后被灭。然而,玩家不太可能会马上反应出来。反馈耗时越长,玩家理解游戏所需要投入的时间也越长。

 

奖励玩家一个出色的游戏

一个好的P&R系统会让玩家感受到对掌握你游戏核心体验的满足感。无论是解救公主还是打败入侵的外星人,P&R可以作为路标,帮助玩家学习在游戏中如何做。在另一方面,糟糕的P&R系统让一个游戏丑陋,没有真正的目标。完好调节的P&R对玩家来说会得到一个更流畅的体验,玩家的想要做的事情和游戏设计的要做的事情之间会和谐。

posted @ 2011-05-08 18:23  Yuri  阅读(419)  评论(1编辑  收藏  举报