2017年6月9日

初识数据挖掘

摘要: 一、何为数据挖掘? 广义的数据挖掘是指知识发现的全过程。又成为数据库中知识发现(Knowledge Discovery in Databases,KDD)。 注意:数据库查询系统和专家系统不是数据挖掘!在小规模数据上的统计分析和学习过程也不算是数据挖掘。 数据挖掘:从大量的、不完全的、有噪声的、模糊 阅读全文

posted @ 2017-06-09 11:05 CuriousZero 阅读(206) 评论(0) 推荐(0) 编辑

无监督学习典例:聚类

摘要: 聚类算法/分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。 聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。 聚类分析以相似性为基础,在一个聚类中的模式之 阅读全文

posted @ 2017-06-09 10:46 CuriousZero 阅读(458) 评论(0) 推荐(0) 编辑

机器学习之:监督学习与无监督学习

摘要: 一、监督学习(supervised learning) 通过已有的训练样本(即已知数据以及其对应的输出)来训练,从而得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,对输出结果进行简单的判 断从而实现分类的目的,那么这个最优模型也就具有了对未知数据进行分类的能力。监督学习中只要 阅读全文

posted @ 2017-06-09 10:44 CuriousZero 阅读(541) 评论(0) 推荐(0) 编辑

大数定律

摘要: 大数定律(law of large numbers):是一种描述当试验次数很大时所呈现的概率性质的定律。 但是注意到,大数定律并不是经验规律,而是在一些附加条件上经严格证明了的定理,它是一种自然规律因而通常不叫定理而是大数“定律”。 而我们说的大数定理通常是经数学家证明并以数学家名字命名的大数定理, 阅读全文

posted @ 2017-06-09 10:24 CuriousZero 阅读(938) 评论(0) 推荐(0) 编辑

导航