摘要: 我个人认为直接讨论数据挖掘算法和weka的使用过于心急。我一开始就直接学习的数据挖掘方法,有些方法艰涩枯燥,我常常在思考的不是方法本身,而是“这是干什么的?”。在使用了weka后有些东西渐渐清晰,因为输入和输出给了人很直观的感觉,再结合技术本身学习效率很高。输入主要有三类:概念、实例和属性。概念概念简单而言就是需要被处理的东西。它可以是分类学习中那个已经分类完成的样本集。你需要处理的东西可能差别很大,但你可以统称它们为概念,而输出就是对其的描述,即概念描述。实例实例这个词你可能觉得陌生,但是你可以大致认为其为样本。我们通常的输入是一个实例集,其中的每一个实例都是单一、独立的概念样本。当然最常见 阅读全文
posted @ 2012-03-30 00:21 夜明的孤行灯 阅读(30548) 评论(7) 推荐(4) 编辑
返回顶部