重构-改善既有代码的设计:重新组织数据的16种方法(六)

重新组织数据:

1.Self Encapsulate Field 自封装字段

间接访问类的属性:你直接访问一个字段,但与字段之间的耦合关系逐渐变得笨拙。为这个字段建立取值/设值函数,并且只以这些函数来访问字段。


       间接访问变量的好处是,子类可以通过覆写一个函数而改变获取数据的途径;它还支持更灵活的数据管理方式,例如延迟初始化。

       如果你想访问超类中的一个字段,却又想子类中将对这个变量的访问改为一个计算后的值,这就是使用Self Encapsulate Field (自封装字段)的时候。“字段自我封装”只是第一步。完成自我封装后,你可以在子类中根据自己的需要随意覆写取值/设值函数。

2. Replace Data Value with Object 对象取代数据值

聚合改为组合:你有一个数据项,需要与其他数据和行为一起使用才有意义。将数据项变成对象


开发初期,你往往决定以简单的数据项表示简单的情况。但是,随着开发的进行,你可能会发现,这些简单数据项不再那么简单了。如果这样的数据项只有一两个,你还可以把相关函数放进数据项所属的对象里;但是重复代码(Duplicated Code)坏味道和 依恋情结(Feature Envy)坏味道很快就会从代码中散发出来,当这些坏味道开始出现,就应该将数据值变成对象。

3.Change value to Reference 将值对象改为引用对象

组合改为重数性关联(另一个类的一个对象与一个或多个该类对象有关系 Customer类对象可以包含多个order类的对象。):从一个类中衍生出许多彼此相等的实例,希望将它们替换为一个对象。将这个值对象变成引用对象。(Customer是一个实值对象,就算多份订单属于一个客户每个Order对象还是拥有各自的Customer对象。重构的结果是所有的订单对象共享一个客户名称。也就是,一个客户对象只对应一个客户名称。



    可以将对象分成两类:reference object(引用对象)和value object(实值对象)。
有一个实值对象,在其中保存了少量的不可修改的数据。你需要给这个对象加入一些可修改的数据,并确保对任何一个对象的修改都能影响到所有引用此对象的地方。这是后就需要将value object(实值对象)变成一个reference object(引用对象)。

        在许多系统中,都可以对对象做一个有用的分类:引用对象和值对象。要在引用对象和值对象之间做选择有时并不容易。有时候,你会从一个简单的值对象开始,在其中保存少量不可修改的数据。而后,你可能会希望给这个对象加入一些可修改数据,并确保对任何一个对象的修改都能影响到所引用此对象的地方。这时候你就需要将这个对象变成引用对象。


4. Change Reference to Value 将引用对象改为值对象

你有一个引用对象,很小且不可变,而且不易管理。将它变成一个值对象。

 

       要在引用对象和值对象之间做选择,有时并不容易。做出选择后,你常会需要一条回头路,

       如果引用对象开始变得难以使用,也许就应该将它改为值对象。引用对象必须被某种方式控制,你总是必须向其控制者请求适当的引用对象。它们可能造成内存区域之间错综复杂的关联。在分布式和并发系统中,不可变的值对象特别有用,因为你无需考虑它们的同步问题。

       值对象有一个非常重要的特征:它们应该是不可变的。无论何时,只有你调用同一对象的同一个查询函数,都应该得到同样结果。如果保证了这一点,就可以放心地以多个对象表示同一个事物。如果值对象是可变的,你就必须确保某个对象的修改会自动更新其他“代表相同事物”的对象。与其如此还不如把它变成引用对象。

       澄清下“不可变”(immutable)的意思:如果你以money类表示“钱’的概念,其中有”币种“和”金额“2条信息。那么Money对象通常是一个不可变的值对象。这并非意味你的薪资不能改变,而是意味:如果要改变你的薪资,就需要使用另一个Money对象来取代现有的Money对象,而不是在现有的Money对象上修改。你和Money对象之间的关系可以改变,但Money对象自身不能改变。

5.Replace Array with Object 以对象取代数组

你有一个数组,其中的元素各自代表不同的东西。以对象替换数组,对于数组中的每个元素,以一个字段来表示。

数组时一种常见的用以组织数据的结构。不过,它们应该只用于“以某种顺序容纳一组相似对象”。有时候你会发现,一个数组容纳了多种不同对象,这会给用户带来麻烦,因为他们很难记住像“数组的第一个元素是人名”这样的约定。对象就不同了,你可以运用字段名和函数名来传达这样的信息,因此你无需死记它,也无需依赖注释。而且如果使用对象,你还可以将信息封装起来。并使用 Move Method (搬移函数)为它加上相关行为。


6. Duplicate Observed data 复制被监视数据

你有一些领域数据置身于GUI控件中,而领域函数需要访问这些数据。将该数据复制到一个领域对象中。建立一个Observer模式,用以同步领域对象和GUI对象内的重复数据。


一个分层良好的系统,应该将处理用户界面和处理业务逻辑的代码分开。之所以这样做,原因有以下几点:1)你可能需要使用不同的用户界面来表现相同的业务逻辑,如果同时承担2种责任,用户界面会变得过分复杂;2)与GUI隔离后,领域对象的维护和演化都会更容易,你甚至可以让不同的开发者负责不同部分的开发。

       尽管可以轻松地将“行为”划分到不同部位,“数据”却往往不能如此。同一项数据可能既需要内嵌于GUI控件,也需要保存于领域模型里。自从MVC模式出现后,用户界面框架都使用多层系统来提供某种机制,使你不但可以提供这类数据,并保持它们同步。

       如果你遇到的代码是以2层方式开发,业务逻辑被内嵌于用户界面之中,你就有必要将行为分离出来。其中的主要工作就是函数的分解和搬移。但数据就不同了;你不能仅仅只是移动数据,必须将它复制到新的对象中,并提供相应的同步机制。

 

7.Change Unidirection Association to Bidirectional 将单向关联改为双向关联

两个类都需要使用对方特性,但其间只有一条单向连接。添加一个反向指针,并使修改函数能够同时更新2条连接。

   

开发初期,你可能会在2个类之间建立1条单向连接,使其中一个类可以使用另一个类。随着时间推移,你可能发现被引用类需要得到其引用者以便进行某些处理。也就是说它需要一个反向指针。但指针是一种单向连接,你不可能反向操作它。通常你可以绕道而行,虽然会耗费一些计算时间,成本还算合理,然后你可以在被引用类中建立一个函数专门负责此行为。但是,有时候想绕过这个问题并不容易,此时就需要建立双向引用关系,或称为反向指针。如果使用不当,反向指针和很容易造成混乱;但只要你习惯了这种手法,它们其实并不太复杂。

       “反向指针”手法有点棘手,所以在你能够自如运用之前,应该有相应的测试。通常不用花心思去测试访问函数,因为普通访问函数的风险没有高到需要测试的地步,但本重构要求测试访问函数,所以它是极少数需要添加测试的重构手法之一。

       本重构运用反向指针实现双向关联,其他技术需要其他重构手法。

8.Change Bidirectional  Association to Unidirection将双向关联改为单向关联

两个类之间有双向关联,但其中一个类如今不再需要另一个类的特性。去除不必要的关联。

双向关联很有用,但你必须为它付出代价,那就是维护双向连接、确保对象被正确创建和删除而增加的复杂度。而且,由于很多程序员并不习惯使用双向关联,它往往成为错误之源。

       大量的双向连接也很容易造成“僵尸对象”:某个对象本来应该死亡了,却仍然保留在系统中,因为对它的引用没有完全清除。

       此外,双向关联也迫使2个类之间有了依赖:对其中任一个类的任何修改,都可能引发另一个类的变化。如果这2个类位于不同的程序集,这种依赖就是程序集之间的相依。过多的跨程序集依赖会造就紧耦合的系统,使得任何一点小小改动就可能造成许多无法预知的后果。

       只有在真正需要双向关联的时候,才该使用它。如果发现双向关联不再有存在价值,就应该去掉不必要的一条关联。



9.Replace Magic Number with Symbolic Constant字面常量取代魔法数

你有一个字面数值,带有特别含义。创建一个常量,根据其意义为它命名,并将上述的字面数值替换为这个常量。

        在计算科学中,魔法数是历史悠久的不良现象之一。所谓魔法数是指拥有特殊意义,却又不能明确表现出这种意义的数字。如果你需要在不同的地点引用同一个逻辑数,魔法数会让你烦恼不已,因为一旦这些数发生变化,你就必须在程序中找到所有魔法数,并将它们全部修改一遍。就算你不需要修改,要准确指出每个魔法数的用途,也会让你颇费脑筋。

       许多语言都允许声明常量。常量不会造成任何性能开销,却可以大大提高代码的可读性。

       进行本项重构之前,你应该先寻找其他替代方案。你应该观察魔法数任何被使用,而后你往往会发现一种更好的使用方式。如果这个魔法数是个类型码,请考虑使用 Replace Type Code with Class (以类取代类型码);如果这个魔法数代表一个数组的长度,请在遍历数组时,改用数组.length。

10.Encapsulate Field 封装字段

你的类中存在一个public字段。将它声明为private,并且提供相应的访问函数。

面向对象的首要原则之一就是封装,或者称为“数据隐藏”。按此原则,你绝不应该将数据声明为public,否则其他对象就有可能访问甚至修改这项数据,而拥有该数据的对象却毫无察觉。于是,数据和行为就被分开了。

       数据声明为public被看做是一种不好的做法,因为这样会降低程序的模块化程度。数据和使用该数据的行为如果集中在一起,一旦情况发生变化,代码的修改就会比较简单,因为需要修改的代码都集中于同一块地方,而不是星罗棋布地散落在整个程序中。

       Encapsulated Field (封装字段)是封装过程的第一步,通过这项重构手法,你可以将数据隐藏起来,并通过相应的访问函数。但它毕竟只是第一步。如果一个类除了访问函数外不能提供其他行为,它终究只是一个哑巴类。这样的;类并不能享受对象技术带来的好处。实施Encapsulated Field (封装字段)之后,尝试寻找用到新建访问函数的代码,看看是否可以通过简单的 Move Method(搬移函数)将它们移到新对象去。


11.Encapsulate Coolection 封装集合

有一个函数返回一个集合。让这个函数返回该集合的一个只读副本,并在这个类中提供添加/移除集合元素的函数。

我们常常会在一个类中使用集合来保存一组实例。这样的类通常也会提供针对该集合的取值/设值函数。

       但是,集合的处理方式应该和其他种类的数据略有不同。取值函数不该返回集合自身,因为这会让用户得以修改集合内容而集合拥有者却一无所悉。也会对用户暴露过多对象内部数据结构信息。如果一个取值函数确实需要返回多个值,它应该避免用户直接操作对象内所保存的集合。并隐藏对象内与用户无关的数据结构。

       另外,不应该为这整个集合提供设值函数,但应该提供用以为集合添加/移除元素的函数。这样,集合拥有者就可以控制集合元素的添加和移除。

       如果你做到以上几点,集合就被很好地封装起来,这便可以降低集合拥有者和用户之间的耦合度。

12.Replace Record with Data Class 以数据类取代记录

       你需要面对传统编程环境中的记录结构。为该记录创建一个“哑”数据对象。
       记录型结构是许多编程环境的共同性质。有一些理由使它们被带进面向对象程序之中:你可能面对的是一个遗留程序,也可能需要通过一个传统API来与记录结构交流,或是处理从数据库读出的记录。这些时候你就有必要创建一个接口类,用以处理这些外来数据。最简单的做法就是先建立一个看起来类似外部记录的类,以便日后将某些字段和函数搬移到这个类中。一个不太常见但非常令人注目的情况是:数组中的每个位置上的元素都有特定含义,这种情况下应该使用 Replace Array with Object (以对象取代数组)。

13. Replace Type Code with Class 以类来取代类型码

类之中有一个数值类型码,但它并不影响类的行为。以一个新的类替换该数值类型码。

在以C为基础的编程语言中,类型码或枚举值很常见。如果带着一个有意义的符号名,类型码的可读性还不错。问题在于,符号名终究只是个别名,编译器看见的、进行类型检验的,还是背后那个数值。任何接受类型码作为参数的函数,所期望的实际上是一个数值,无法强制使用符号名。这会大大降低代码的可读性,从而成为bug之源。

       如果把那样的数值换成一个类,编译器就可以对这个类进行类型检验。只要为这个类提供工厂函数,你就可以始终保证只有合法的实例才会被常见出来,而且他们都会被传递给正确的宿主对象。

       但是,在使用Replace Type Code with Class (以类取代类型码)之前,你应该先考虑类型码的其他替换方式。只有当类型码是纯粹数据时(也就是类型码不会在switch语句中引起行为变化时),你才能以类来取代它。更重要的是:任何switch语句都应该运用Replace Conditional with Polymorphism (以多态取代条件表达式)去掉。为了进行那样的重构,你首先必须运用 Replace Type Code with Subclass (以子类取代类型码)或Replace Type Code with State/Strategy (以状态策略取代类型码),把类型码处理掉。

       即使一个类型码不会因其数值的不同而引起行为上的差异,宿主类中的某些行为还是可能更适合放置于类型码类中,因此你还应该留意是否有必要使用Move Method(搬移函数)将一两个函数搬过去。

14.Replace Type Code with Subclasses 以子类来取代类型码

  你有一个不可变的类型码,它会影响类的行为。以子类取代这个类型码。
 

如果你面对的类型码不会影响宿主类的行为,可以使用Replace Type Code with Class (以类取代类型码)来处理它们。但如果类型码会影响宿主类的行为,那么最后的办法就是借助多态来处理变化行为。

       一般来说,这种情况的标志就是像switch这样的条件表达式。这种条件表达式可能有2种表现形式:switch语句或者if –then-else结构。不论哪种形式,它们都是检查类型码值,并根据不同的值执行不同的动作。这种情况下,你应该以 Replace Conditional with Polymorphism (以多态取代条件表达式)进行重构。但为了那个顺利进行那样的重构,首先应该将类型码替换为可拥有多态行为的继承体系。这样一个继承体系应该以类型码宿主类为基类,并针对每一种类型码建立一个子类。

       但是以下2种情况你不能那么做1)类型码值在对象创建之后发生了变化;2)由于某种原因,类型码宿主类已经有了子类。如果你恰好面临这2种情况之一,就需要运用 Replace Type Code with StateStrategy (以状态策略取代类型码)。

       Replace Type Code with Subclass (以子类取代类型码)的主要作用其实是搭建一个舞台,让Replace Conditional with Polymorphism (以多态取代条件表达式)得以一展身手。如果宿主类中并没有出现条件表达式,那么Replace Type Code with Class (以类取代类型码)更合适,风险也较低。

       使用Replace Type Code with Subclass (以子类取代类型码)的另一个原因是,宿主类中出现了“只与具备特定类型码之对象相关”的特性。完成本项重构后,你可以使用 push down Method (函数下移)和push down field (字段下移)将这些特性推到合适的子类中去,以彰显它们只与特定情况相关这一事实。

       Replace Type Code with Subclass (以子类取代类型码)的好处在于:它把“对不同行为的了解”从类用户那转移到了类自身。如果需要再加入新的行为变化,只需要添加一个子类就行了。如果没有多态机制,就必须找到所有条件表达式,并逐一修改它们。因此,如果为了还有可能加入新行为,这项重构将特别有价值。

15.Replace Type Code with State/Strategy 以状态/策略取代类型码

你有一个类型码,它会影响类的行为,但你无法提供继承手法消除它。以状态对象取代类型码。
 

本项重构和Replace Type Code with Subclass (以子类取代类型码)类似,但如果“类型码在对象生命期中发生变化”或“其他原因使得宿主类不能被继承”,你也可以使用本重构。本重构使用State模式和Strategy模式。

       State模式和Strategy模式非常相似,因此无论你选择其中哪一个,重构过程都是一样的。“选择哪个模式”并非问题的关键所在,你只需要选择更合适特定情境的模式就行了。如果你打算在完成本重构后再以Replace Conditional with Polymorphism (以多态取代条件表达式)简化一个算法,那么选择Strategy模式较合适;如果你打算搬移状态相关的数据,而且你把新建对象视为一种变迁状态,就应该选择State模式。

 

16.Replace Subclass with Fieldls 以字段取代子类

你的各个子类的唯一差别只在“返回常量数据”的函数身上。修改这些函数,使它们返回超类中的某个(新增)只读,然后销毁子类。

       建立子类的目的,是为了增加新特性或变化其行为。有一种变化行为被称为“常量函数”,它们会返回一个硬编码的值。这东西有其用途:你可以让不同的子类中的同一个访问函数返回不同的值。你可以在超类中将访问函数声明为抽象函数,并在不同子类中让它返回不同的值。

       尽管常量函数有其用途,但若与子类中只有常量函数,实在没有足够的存在价值。你可以在超类中设计一个与常量函数返回值相应的字段,从而完全除去这样的子类。如此一来就可以避免因继承而带来的额外复杂性。




posted @ 2012-05-29 16:16  夏至冬末  阅读(406)  评论(0编辑  收藏  举报