相似序列搜索
相似序列的搜索问题通常定义为:给定某个时间序列,从一个大型时间序列
数据库中找出与给定的序列模式相似的序列,同时研究相似性的度量标准和检索
的时间复杂性。在时间序列数据挖掘中,相似性问题的研究主要与查询匹配以及
时间序列分类紧密结合在一起。目前,相似性匹配一般分为两类:
①完全匹配:给定一个查询序列X,一个包含N个序列Y1,Y2,⋯,Yn 的序列
集合S且这些序列有相同的长度。找出序列集合U={Yi∈S|D(X,Yi)<epsion},即所有
与X匹配的Yi.
②子序列匹配:给定一个查询序列X,一个包含N个具有任意长度的序列
Y1,Y2,⋯,Yn 的序列集合S,在Yi(1≤i≤N)上找到所有与X之间的距离小于等
于epsion的子序列。