[IR] Advanced XML Compression - XBW
思考:与ISX对比后能得出什么结论
原理解析:
We proposed the XBW-transform that mimics on trees the nice structural properties of the Burrows-and-Wheeler Trasform on strings.
这里也有排序,针对Spi,故有了BWT的味道。
Encoding:
0为首,1为尾。
例如:XBW的第二到四行。
Slast | S | Spi | |
0 | b | AC | CA下的第一个node(孩子结点) |
0 | a | AC | CA下的第二个node(孩子结点) |
1 | D | AC | CA下的第三个node(中间结点) |
如此一来,Slast 更容易压缩。
Decoding:
Features:
C->Spi -> C C C
S列中的B A B在树的C(root)的下一层,且是保序的!
两个B(B, B)如何区分?
B-> 四对 "B C" -> 两对 "0 1" -> 将两个B的所属内容分开!