python魔法方法-比较相关

  在python2.x的版本中,支持不同类型的比较,其比较原则如下:

内置类型:

  1.同一类型:

    1.1)数字类型:包含int、float、long、complex、bool(bool类型是int的子类,且True=1, False=0)。就按照数字的大小进行比较,例如:

  1.2)非数字类型:

  1.2.1)如果类型中定义了如__cmp__、__gt__等魔法方法,就按照其魔法方法的返回值进行比较,具体如何就是这篇文章接下来要讨论的内容。

  1.2.2)如果没有定义上述的魔法方法,就按照 id 函数的返回值进行比较,由于 id 函数返回的是 int,所以返回值按照数字的规则进行比较。

 

  2.不同类型:

  2.1)如果比较的对象中含有数字类型,例如:int 和 str 进行比较。数字类型将小于其他任何类型,也就是说“数字类型是最小的”(不包括None,None比数字类型还小,所以应该说是None最小,但很少会使用None类型比较,所以这里忽略None,得出数字类型最小的结论)。

  2.2)如果比较的对象中不含有数字类型,例如 dict 和 str 进行比较。那么就按类名进行比较,所以 {} < '' 相当于 'dict' < 'str' ,即将类名转换为字符串,然后按字符串的原则进行比较。

这里有几点要补充的:

  虽然内置类型基本都实现了__eq__、__ge__、__gt__等内置方法,但是这里有必要对相同类型实例直接的比较进行总结说明:

1.序列的比较:

  序列的比较是按照索引顺序取出元素进行比较,如果不两个系列不等长,则可以看作是在短的序列后面填充 None ,直到两个序列等长。

  在 tuple 和 list 的讨论中,我使用了打擂台的比喻。两个比较的序列相当于按照索引顺序派出选手,比赛采用的是残酷的赛制,一旦某个选手失败,那么那个队伍就会输掉。也就是说一旦某个元素小于对面,那么整个序列都会小于另一个序列。

  当然这里说的是同一类型的序列,例如 str、list、tuple之间的比较是属于不同内置类型的比较,按照上面的原则,就是按照类名进行比较。所以这里讨论的是 str和 str 的比较;list 和 list 的比较;tuple 和 tuple的比较。

  str 和 str 之间的比较:首先按照序列顺序排出元素,而 str 中的元素就是单个字符,然后字符之间的比较是通过将其转换为 acsll 码后进行数字之间的比较的。python 中提供了一个内置的函数 ord 来进行这项工作:

  还有一个反函数 chr 用来将数字转换成字符:

   所以,当字符串 'abc' 和字符串 'abe' 进行比较时,前两个字符相等,而 'e' > 'c' ,所以 'abe' > 'abc'。

  如果两者不等长时,例如:'abc' 和 'ab' 进行比较,前两字符相等,而 'c' 相对于和 None 比,None又最小,所以 'abc'  > 'ab' 。

  其他序列也遵循这个逐项比较的原则,例如:[1, 2, 3] 和 [1, [2], 3] 比较时,第一个元素相等,所以比第二个元素。第二元素是不同类型的,其中一个是数字,数字除None外最小,所以第二个列表比较大。如果一直比较下去都相等的话,那么就判断两个元素相等(== )。但是这并不意味着两个元素是同一个对象,所以 is 判断不一定为 True。

  另外,中文是按照编码的字符串进行比较的,例如:

  'd' > 'b' 所以 '一' > '二'。但字符串的编码是会根据编码声明而改变的,例如 # coding: utf-8 和 # coding= gbk 的字符串编码就不一样,所以比较会有差异性。但是也很少会进行中文之间的比较。

  集合和序列的比较方法类似。

2.字典间的比较:

  字典其实也类似于序列,也是逐个比较,但字典比较的是不是值,而且字典是无序的,所以比较的顺序难以预测,所以无论如何,不建议字典间的比较。

版本差异:

  由于不同内置类型之间的比较不符合人的直觉,而且行为怪异,难以估计。所以python3.x中取消了不同内置类型之间比较的支持,例如:在python3.x中进行 int 和 str 之间的比较时会直接抛出异常。


 

自定义的类:

  1.继承自基本类型且没有重写相关的魔法方法,那么就按照上面内置类型的原则进行比较。

  2.自定义的类,但没有重写相关魔法方法。那么 新式类 > 经典类;新式类之间按类名进行比较;经典类之间按 id 函数的返回值进行比较。

  3.只要重写了相应的魔法方法,那么就按照魔法方法的返回值作为结果。不管是否继承自基本类型。

 

相关魔法方法:

   __cmp__(self, other) :对应于python的内置函数 cmp ,在self > other 时应该返回 正整数;self == other时,返回 0;当self < other时应该返回一个 负整数。(这个方法因为和下面的方法存在冗余,所以在python3.x中被删除了。)

例子:

class Foo(str):
    def __new__(cls, word):
        return str.__new__(cls, word)

    def __cmp__(self, other):
        if ('scolia' in self) and ('scolia' in other):
            return 0
        elif 'scolia' in self:
            return 1
        else:
            return -1

a = Foo('scolia')
b = Foo('scolia123')
c = Foo('good')
d = Foo('Good')
print cmp(a, b)
print cmp(b, c)
print cmp(c, d)

  在这个例子中,我定义凡是两个字符串中都有子串'scolia'的,都返回0;当个只有一个有,且有的那个作为第一个参数时,返回1;两个都没有,不管是什么都返回-1。

  也就是说cmp函数的第一个参数就是 self ,第二个参数就是 other。

  当然 cmp 还有一个隐藏特性, 当两个参数为同一对象的时候,直接返回0而不管内部的__cmp__逻辑如果,例如:

c = Foo('good')
d = c
print cmp(c, d)

   本来按照自己写的代码的逻辑的话,c 和 d 都不含字串 'scolia' ,应该返回-1才对,但是实际上得到的却是0。说明cmp函数对于同一对象是直接给出结果而不理魔法方法的。

 

  • __eq__(self, other)

  • 定义相等符号的行为,==

  • __ne__(self,other)

  • 定义不等符号的行为,!=

  • __lt__(self,other)

  • 定义小于符号的行为,<

  • __gt__(self,other)

  • 定义大于符号的行为,>

  • __le__(self,other)

  • 定义小于等于符号的行为,<=

  • __ge__(self,other)

  • 定义大于等于符号的行为,>=

 

  以上魔法方法都必须返回一个布尔值

 

例如:

class Foo(str):
    def __new__(cls, word):
        return str.__new__(cls, word)

    def __eq__(self, other):
        if ('scolia' in self ) and ('scolia' in other):
            return True
        else:
            return False

a = Foo('scolia')
b = Foo('scolia123')
print a == b

  所以,这些魔法方法其实就是重载了相应的符号而已,例如这里的 == ,左边的相当于 self,右边的相当于 other。你可以根据自己的需要进行逻辑编排。

又例如:

class Foo(str):
    def __new__(cls, word):
        return str.__new__(cls, word)
    def __gt__(self, other):
        return len(self) > len(other)
    def __lt__(self, other):
        return len(self) < len(other)
    def __ge__(self, other):
        return len(self) >= len(other)
    def __le__(self, other):
        return len(self) <= len(other)

 

  这里重载了多个比较符,是核心是按照字符串的长度进行比较,越长的越大。这里看似返回的是一个表达式,但是函数在真正返回的时候会将这个表达式计算出来,也就是说最终返回的其实还是布尔值。

  而没有重载的比较符,如这里没有重载 __eq__ 即 == ,将自动调用其父类的方法,这也很符合我们继承的概念。

如果和基本类型比较呢:

class Foo(str):
    def __new__(cls, word):
        return str.__new__(cls, word)

    def __eq__(self, other):
        if ('scolia' in self ) and ('scolia' in other):
            return True
        else:
            return False

b = Foo('scolia')
a = 'scolia123'
print a == b
print b == a

  貌似是以我们自己写的方法为准,不管 == 两边的顺序如何。

如果两个自定义的类冲突呢:

class Foo(str):
    def __new__(cls, word):
        return str.__new__(cls, word)

    def __eq__(self, other):
        if ('scolia' in self ) and ('scolia' in other):
            return True
        else:
            return False

class Boo(str):
    def __new__(cls, word):
        return str.__new__(cls, word)

    def __eq__(self, other):
        if ('scolia' in self ) and ('scolia' in other):
            return False
        else:
            return True


a = Foo('scolia')
b = Boo('scolia')
print a == b
print b == a

  此时,谁在 == 号的左边,就运用谁的规则。

 


 

  关于比较的魔法方法就讨论到这里,欢迎大家交流。

  相关的参考资料:戳这里 

 

posted @ 2016-07-17 23:12  scolia  阅读(2458)  评论(0编辑  收藏  举报