【weka应用技术与实践】过滤器

weka中的过滤器主要用于数据预处理阶段对数据集的各种操作。

今天简单地使用一下过滤器:

首先打开一个自带数据集weather.numeric.arff,这是一个关于通过天气条件,气温以及风力等因素来判断是否要play。可以看到:

image

看一下数据的大致情况:

image

红色代表no,蓝色代表yes。

问题一:假设我现在要添加一列新的属性叫“心情”,分类三类:好(good),不好(bad),一般(normal)。该怎么做?

方法:

        1.AddUserFields过滤器:选择该过滤器:

image

new一个:

image

apply之后,可以看到:

image

这样,属性就已经添加完了。

         2.AddValues过滤器:

属性有了,值还没有,所以选择AddValues过滤器:

image

输入之后,再去edit就可以选择了:

image

简单填写完毕之后,

image

        3、Reorder过滤器:

因为weka默认最后一列属性是作为分类属性,因此,我们还得使用reorder分类器,把最后一列调整到前面去,还是把play作为分类列:

image

apply之后,可以看到列已经换了:

image

或者还有一种更快的方法:

image

posted @ 2015-05-15 11:39  max_xbw  阅读(1667)  评论(0编辑  收藏  举报