[思考] 对于外部排序中的败者树正确性的理解

对我来说，想要把某样东西搞懂，首先得用自己能理解的语言对其精髓进行概括。在这一点上，任何书本、任何人所说的都不管用。

我承认自己在败者树这里卡了很久。

原因之一在于，书上讲得很不清楚，仅仅说了败者树在外部排序中使用得比较广泛，模拟了一遍败者树的过程，说明它确实能找到最小值，然后就戛然而止了。

于是我就产生了疑惑——为什么败者树每次只需要调整一次就能更新最小值？

我的意思是，一次两次的模拟并不能说明什么，对于算法和数据结构来说，应给予较为普适的证明，要求低一点，不需要证明，但至少需要一些性质、引理等等，而不是以它的正确性作为前提，通过使用它来证明它的正确性——陷入了循环论证的窘境。

我想，编者的用意大概是让读者自己产生诸如此类的疑问，再自己去解决。对于普通的教程来说是可以，然而，对于一本教科书来说，我认为这是不称职的行为。这样怎么能起到 “教育” 的作用呢？既然打算讲清楚某样东西，就要符合人类思考的基本逻辑，而不是把它直接硬塞过来，说 “大家都是这么用的”。呵呵。

回到正题。针对上述疑惑，我开始思考对应的回答。

其实很简单。当初始的败者树构造完成后，按照败者树的定义，对于一个败者节点来说，在以此败者节点为根的树（它是败者树的子树，下称 “子树”）中，最小元素就是它自己本身。

如何证明？可以使用反证法。如果它不是最小的元素，意味着还有更小的元素留在子树中，但它应该作为胜者上升，而不是停留在子树中。如果这样的 “更小的元素” 确实存在，那么迫使它没有上升的元素一定比它还要小……无论如何，败者节点都无法成为非最小元素，否则总会有更小的元素作为胜者上升，最终顶替掉它的位置。然而，树的结构是不能改变的，因为给定了 “初始的败者树构造完成” 的前提。只有败者节点是子树中最小的，才能保持结构的不变性。

正因为如此，每次加入新元素（从叶子节点加入）时，才只需要和败者节点比较，因为除了新元素外，没有比它更小的元素了，和其他元素比较都不会影响最终结果。