基于结构的距离度量

基于结构的距离度量是找出序列的在较高尺度上的结构,并在全局尺度上进行比较。基于结构的距离度量又可以进一步分成两种:基于模型(model-based)的距离度量和基于压缩(compression-based)的距离度量。
基于模型的距离度量是先对每个待比较的时间序列分别构建各自的全局模型,建好各自的模型后,基于某个序列的模型来尝试生成另一条序列,结果只有两个:能生成和不能生成,
把这种可能生成的概率值作为序列之间相似性的度量。典型的代表方法为基于隐Markov模型HMM(Hidden MarkovModel)和基于自回归平均移动模型 AMRA(Auto RessionMoveing Average)(Xiong and Yeung, 2004)。基于模型的方法的不足之处在于需要预先定义数据满足某种假设,如果不满足,就很难建立较好的模型。基于压缩的距离度量代表方法是CDM(compression-based DissimilarityMeasure),它结合了生物信息学和压縮理论的成果,适用于子序列相似性的度量和发现。但是由于CDM中Lemple-ziv复杂性的计算复杂度为0(n2),计算过程非常复杂和耗时,存在很多参数需要给予正确合理设置,所以限制了它的应用。

posted @ 2018-06-21 22:41  Lucas_Yu  阅读(297)  评论(0编辑  收藏  举报