纠错输出编码法ECOC

纠错输出编码法（Error-Correcting Output Codes，ECOC）不仅能够将多类分类问题转化为多个两类问题，而且利用纠错输出码本身具有纠错能力的特性，可以提高监督学习算法的预测精度。

将多类问题两类化的重要途径是对输出的类别进行编码，即每个类别对应一个长度为n的二进制位串（称为码字），共形成m个码字，这些码字的同一位描述了一个二值函数。学习结束后获得n个二分器，在分类阶段，每个二分器对输入样本产生的输出形成输出向量，然后由决策规则判定输入样本的类别。

纠错输出编码法：将机器学习问题看做数据通信问题，并采用纠错输出码对各类别进行编码，因此在分类过程中能够纠正某些二分器的错误输出，从而提高分类器的预测精度。

在编码理论中，利用汉明距离可以确定分组码的纠错能力，我们也采用汉明距离确定输出码的纠错能力。

纠错输出码矩阵的行数等于监督分类问题的类别数m，列数等于码长n，一个有用的纠错输出码应该具有以下特性：

1.具有一定的纠错能力。

2.码矩阵中无全0列，无全1列。

3.码矩阵中无相同列，无互补列。

常用的编码方法：列举编码法、随机爬山法、BCH编码法、连续编码法、搜索编码法。

posted @ 2014-02-19 17:18 黎嫣阅读(4893) 评论(2) 编辑收藏举报

刷新页面返回顶部

自由天空自由飞