[IR] Advanced XML Compression - XBW

思考:与ISX对比后能得出什么结论


 

原理解析:

We proposed the XBW-transform that mimics on trees the nice structural properties of the Burrows-and-Wheeler Trasform on strings.

这里也有排序,针对Spi,故有了BWT的味道。

 

Encoding:

 

   

 

0为首,1为尾。

例如:XBW的第二到四行。

Slast S Spi  
0 b AC CA下的第一个node(孩子结点)
0 a AC CA下的第二个node(孩子结点)
1 D AC CA下的第三个node(中间结点)

如此一来,Slast 更容易压缩。

 

 

Decoding:

  

 

 

Features:

C->Spi -> C C C

S列中的B A B在树的C(root)的下一层,且是保序的

两个B(BB)如何区分?

B-> 四对 "B C" -> 两对 "0 1" -> 将两个B的所属内容分开

  

posted @ 2017-06-06 15:19  郝壹贰叁  阅读(328)  评论(0编辑  收藏  举报