摘要: 编号数据挖掘技术应用算法优势劣势1决策树(Decision Tree)用户划分、行为预测、规则梳理CHAIDCARTID3、C4.5、C5.01、决策树的构造不需要任何领域的知识,很适合探索式的知识发掘,并且可以处理高维度的数据2、决策树所产生的一系列从树根到树枝(或树叶)的规则,可以很容易地被分析... 阅读全文
posted @ 2015-08-02 11:09 景瑜 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 单样本t检验用于检验一个样本均值与假设的总体均值的差异是否显著。 对于一个总体来说,其集中趋势或者说中心值是我们关心的,因此需要了解总体的均值,但是由于总体的不可知性,我们首先对总体均值的取值进行假设,然后对总体进行抽样,通过样本均值的情况来检验我们对总体均值的假设是否成立,根据假设检验的小概率原则,如果在我们假设的总体均值下,样本均值观测值出现的概率是小概率,那么说明总体均值的假设是错误的,反之... 阅读全文
posted @ 2015-07-18 10:56 景瑜 阅读(12201) 评论(0) 推荐(1) 编辑
摘要: 在平均数的计算公式中,每个都有相同的重要性或权重。但有时候,计算平均数时会对每个观测值赋予显示其重要性的权重。以这种方式计算的平均数称做加权平均数。 加权平均数: ——第个观测值的数值; ——第个观测值的权重; 举个例子来说明什么时候需要使用加权平均数。下面是一个公司在过去3个月5次购买原材料的样本。 购买批次价格(美元/磅)数量(磅)13.00120023.4050032.80275042.9... 阅读全文
posted @ 2015-07-08 14:47 景瑜 阅读(895) 评论(0) 推荐(0) 编辑