二叉树的序列化和反序列化(Java)

概述

关于面试中常见的其他二叉树算法题，参考面试+算法之二叉树(Java)。二叉树的定义（注意到有使用lombok提供的两个注解）：

@lombok.Data
@lombok.AllArgsConstructor
private static class TreeNode {
    private TreeNode left;
    private TreeNode right;
    private final int val;

    TreeNode(int x) {
        this.val = x;
    }
}

将有序数组转换为二叉搜索树

给定一个升序排序的整数数组nums，将其转换为一棵高度平衡的二叉搜索树。来自LeetCode

分析：给定一个有序数组，转换成二叉搜索树，即左子树小于根节点，根节点小于右子树，满足条件的二叉搜索树显然不止一种。

一般情况下，大多数人都会考虑取数组的中间元素作为根节点。为啥选择中间元素，为了确保得到的二叉树的高度差尽可能小。如果数组的元素个数是奇数，根节点可以唯一确定；如果是偶数，则根节点不唯一。所以，

如果题目没有限定高度平衡的二叉树，则得到的二叉树将会更多。最差的情况就是退化成仅有根节点和左子树或右子树的二叉树，即退化成类似链表的结构。

采用递归的方法：

public static TreeNode sortedArrayToBST(int[] nums) {
    return traversal(nums, 0, nums.length - 1);
}

private static TreeNode traversal(int[] nums, int left, int right) {
    if (left > right) {
    	// 叶子节点
        return null;
    }
    int mid = left + ((right - left) / 2);
    TreeNode node = new TreeNode(nums[mid]);
    node.left = traversal(nums, left, mid - 1);
    node.right = traversal(nums, mid + 1, right);
    return node;
}

从中序与后序遍历序列构造二叉树

来自LeetCode

public static TreeNode buildTree(int[] inOrder, int[] postOrder) {
    return helper(inOrder, postOrder, postOrder.length - 1, 0, inOrder.length - 1);
}

private static TreeNode helper(int[] inOrder, int[] postOrder, int postEnd, int inStart, int inEnd) {
    if (inStart > inEnd) {
        return null;
    }
    int currentVal = postOrder[postEnd];
    TreeNode current = new TreeNode(currentVal);
    int inIndex = 0;
    for (int i = inStart; i <= inEnd; i++) {
        if (inOrder[i] == currentVal) {
            inIndex = i;
        }
    }
    TreeNode left = helper(inOrder, postOrder, postEnd - (inEnd - inIndex) - 1, inStart, inIndex - 1);
    TreeNode right = helper(inOrder, postOrder, postEnd - 1, inIndex + 1, inEnd);
    current.left = left;
    current.right = right;
    return current;
}

序列化

递归的思想，采用前序遍历，对空节点需要特殊处理，使用任何占位符都可：

public static String serialize(TreeNode root) {
    StringBuilder sb = new StringBuilder();
    serializeHelper(root, sb);
    return sb.substring(0, sb.length() - 1);
}

private static void serializeHelper(TreeNode node, StringBuilder sb) {
    if (node == null) {
        sb.append("#,"); // 空节点
        return;
    }
    sb.append(node.val).append(",");
    serializeHelper(node.left, sb);
    serializeHelper(node.right, sb);
}

反序列化

能否从序列化后的字符串，反序列化得到一棵树呢？
答案是可以的。前提是知道对空节点的处理（填位字符串）策略，节点的间隔（字符）策略。

能否从序列化后的字符串，反序列化得到原始的二叉树？
答案是不一定，如果想要反序列化得到原始的二叉树，有一些前提条件：

序列化方案，是前序、中序还是后序
对空节点的处理策略
节点的间隔（字符）策略

public static TreeNode deserialize(String data) {
    LinkedList<String> nodes = new LinkedList<>(Arrays.asList(data.split(",")));
    return deserializeHelper(nodes);
}

private static TreeNode deserializeHelper(LinkedList<String> nodes) {
    String val = nodes.removeFirst();
    if (val.equals("#")) {
        return null;
    }
    TreeNode node = new TreeNode(Integer.parseInt(val));
    node.left = deserializeHelper(nodes);
    node.right = deserializeHelper(nodes);
    return node;
}

测试方法：

public static void main(String[] args) {
	TreeNode head = init();
	String s = serialize(head);
	// TreeNode.toString()方法
	String b = deserialize(s).toString();
	System.out.println("序列化：" + s);
	System.out.println("反序列化：" + b);
}

附TreeNode.toString()方法：

@Override
public String toString() {
    return toString(this);
}

public String toString(TreeNode r) {
    if (r == null) {
        return "#";
    } else {
        return r.val + "," + toString(r.left) + "," + toString(r.right);
    }
}

输出：

序列化：8,4,2,#,1,#,#,3,#,#,7,#,6,5,#,#,#
反序列化：8,4,2,#,1,#,#,3,#,#,7,#,6,5,#,#,#

结论：

已知序列化方案和空节点处理策略后，可唯一反序列化得到原始二叉树
二叉树的打印方法里对空节点的处理策略保持一致，且间隔符都是,，则两个字符串相等

进阶

如果不知道序列化方案，如何反序列化得到二叉树？

结论：可以反序列化，但是不一定是原始的二叉树，所以这个反序列化也没有任何意义。

为了解决这个问题，有几个选择：

使用包含遍历顺序信息的序列化格式：
在序列化字符串中包含遍历顺序信息。例如，在字符串前面加上遍历顺序的标识符（如P表示前序(Pre-order)，I表示中序(In-order)，O表示后序(post-Order)）。
双序列化：
使用两种不同的遍历顺序分别序列化树，并将两个序列化结果一起保存。两种方案字符|以分隔。例如，使用前序和中序，或后序和中序。

其中方案二基于这样一个已被证实的结论：若存在对同一棵二叉树的两种不一样的遍历（序列化）方案，则一定可以唯一确定这棵二叉树。

/**
 * 序列化二叉树（前序和中序）
 */
public static String serialize1(TreeNode root) {
    StringBuilder preOrder = new StringBuilder();
    StringBuilder inOrder = new StringBuilder();
    serializePreOrder(root, preOrder);
    serializeInOrder(root, inOrder);
    return preOrder.toString() + "|" + inOrder.toString(); // 使用 | 作为分隔符
}

private static void serializePreOrder(TreeNode node, StringBuilder sb) {
    if (node == null) {
        sb.append("#,");
        return;
    }
    sb.append(node.val).append(",");
    serializePreOrder(node.left, sb);
    serializePreOrder(node.right, sb);
}

private static void serializeInOrder(TreeNode node, StringBuilder sb) {
    if (node == null) {
        sb.append("#,");
        return;
    }
    serializeInOrder(node.left, sb);
    sb.append(node.val).append(",");
    serializeInOrder(node.right, sb);
}

/**
 * 反序列化二叉树
 */
public static TreeNode deserialize1(String data) {
    // 需预知的信息：两个字符串的分隔符
    String[] parts = data.split("\\|");
    // 需预知的信息：序列化的间隔符
    LinkedList<String> preOrderNodes = new LinkedList<>(Arrays.asList(parts[0].split(",")));
    LinkedList<String> inOrderNodes = new LinkedList<>(Arrays.asList(parts[1].split(",")));
    return buildTree(preOrderNodes, inOrderNodes);
}

private static TreeNode buildTree(LinkedList<String> preOrderNodes, LinkedList<String> inOrderNodes) {
    // 需预知的信息：对空节点的处理策略
    if (preOrderNodes.isEmpty() || preOrderNodes.peek().equals("#")) {
        preOrderNodes.poll();
        inOrderNodes.poll();
        return null;
    }
    String rootVal = preOrderNodes.poll();
    TreeNode root = new TreeNode(Integer.parseInt(rootVal));
    int inOrderIndex = inOrderNodes.indexOf(rootVal);
    root.left = buildTree(preOrderNodes, new LinkedList<>(inOrderNodes.subList(0, inOrderIndex)));
    root.right = buildTree(preOrderNodes, new LinkedList<>(inOrderNodes.subList(inOrderIndex + 1, inOrderNodes.size())));
    inOrderNodes.poll();
    return root;
}