随笔分类 -  Data Mining

data analysis and data mining
摘要:一、基础概念 1. 相似度(similarity): 两个对象相似程度的数值度量,通常相似度是非负的,在[0,1]之间取值 相异度(disimilarity): 两个对象差异程度的数值度量,通常也是非负的,在[0,1]之间取值,0到$\infty$也很常见 我们使用邻近度(proximity)表示相 阅读全文
posted @ 2017-07-31 16:37 VincentCheng 阅读(2433) 评论(0) 推荐(0)
摘要:一、概念 特征选择feature selection:也被称为variable selection或者attribute selection. 是选取已有属性的子集subset来进行建模的一种方式. 进行特征选择的目的主要有: 简化模型,缩短训练时间,避免维数灾难(curse of dimensio 阅读全文
posted @ 2017-07-23 10:23 VincentCheng 阅读(7080) 评论(0) 推荐(0)