随笔分类 - Data Mining
data analysis and data mining
摘要:一、基础概念 1. 相似度(similarity): 两个对象相似程度的数值度量,通常相似度是非负的,在[0,1]之间取值 相异度(disimilarity): 两个对象差异程度的数值度量,通常也是非负的,在[0,1]之间取值,0到$\infty$也很常见 我们使用邻近度(proximity)表示相
阅读全文
摘要:一、概念 特征选择feature selection:也被称为variable selection或者attribute selection. 是选取已有属性的子集subset来进行建模的一种方式. 进行特征选择的目的主要有: 简化模型,缩短训练时间,避免维数灾难(curse of dimensio
阅读全文

浙公网安备 33010602011771号