纠错输出编码法ECOC

纠错输出编码法(Error-Correcting Output CodesECOC)不仅能够将多类分类问题转化为多个两类问题,而且利用纠错输出码本身具有纠错能力的特性,可以提高监督学习算法的预测精度。

将多类问题两类化的重要途径是对输出的类别进行编码,即每个类别对应一个长度为n的二进制位串(称为码字),共形成m个码字,这些码字的同一位描述了一个二值函数。学习结束后获得n个二分器,在分类阶段,每个二分器对输入样本产生的输出形成输出向量,然后由决策规则判定输入样本的类别。

纠错输出编码法:将机器学习问题看做数据通信问题,并采用纠错输出码对各类别进行编码,因此在分类过程中能够纠正某些二分器的错误输出,从而提高分类器的预测精度。

在编码理论中,利用汉明距离可以确定分组码的纠错能力,我们也采用汉明距离确定输出码的纠错能力。

 

纠错输出码矩阵的行数等于监督分类问题的类别数m,列数等于码长n,一个有用的纠错输出码应该具有以下特性:

1.具有一定的纠错能力。

2.码矩阵中无全0列,无全1列。

3.码矩阵中无相同列,无互补列。

 

常用的编码方法:列举编码法、随机爬山法、BCH编码法、连续编码法、搜索编码法。

posted @ 2014-02-19 17:18  黎嫣  阅读(4893)  评论(2编辑  收藏  举报