2015年10月11日

数据挖掘导论学习笔记之分类基本概念、决策树与模型评估

摘要: 分类分类任务的输入数据是记录的集合,每条记录也称实例或样例,用元组(x,y)来表示,其中x是属性的集合,而y是一个特殊的属性,指出样例的类标号。类标号在分类中是离散属性,回归确是一种预测建模任务,其中目标属性y是连续的。概念 分类任务就是通过学习得到一个目标函数f,把每个属性集x... 阅读全文

posted @ 2015-10-11 22:05 爱你一万年123 阅读(275) 评论(0) 推荐(0) 编辑

数据挖掘导论笔记之探索数据

摘要: 鸢尾花鸢尾花(Iris)数据集可以从加州大学欧文分校(UCI)的机器学习库中获取,包含150种鸢尾花的信息,每50种取自三个原味鸢尾花种之一:Setosa、Versicolour和Virgincia。每个花的特征用下面5种属性描述。萼片长度(厘米)萼片宽度 (厘米)花瓣长度(厘米)... 阅读全文

posted @ 2015-10-11 17:04 爱你一万年123 阅读(477) 评论(0) 推荐(0) 编辑

导航