懵懂的菜鸟

Stay hungry,Stay foolish.

导航

上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 34 下一页

2017年9月30日 #

无监督学习

摘要: 无监督学习 监督学习通过发现数据的其他属性和类别属性之间的关联模式并通过对这些模型来预测未知数据实例的类别属性。这些属性通常表示一些现实世界中的预测或分类问题,例如通过判断新闻是属于体育类还是属于政治类,而在其他的应用中,数据的类别属性却是缺失的。用户希望通过浏览数据来发现其中的某些内在结构。例如聚类是一种发现这种内在结构的技术。聚类把全体数据实例组织成一些相似组,这些相似组被称为聚类。处于相同聚... 阅读全文

posted @ 2017-09-30 11:24 懵懂的菜鸟 阅读(178) 评论(0) 推荐(0) 编辑

朴素贝叶斯分类

摘要: 朴素贝叶斯分类 1 朴素贝叶斯分类 监督学习可以从概率的角度来认识,分类的任务可以看做是给定一个测试样例后,估计目标出现的条件概率,即后验概率。 首先给出条件概率公式,即: 然后给出,贝叶斯定理: 朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就... 阅读全文

posted @ 2017-09-30 11:23 懵懂的菜鸟 阅读(1387) 评论(0) 推荐(0) 编辑

监督学习

摘要: 监督学习 1 监督学习 在机器学习中,监督学习又被成为分类(Classfication)或者归纳学习(Inductive Learning),这种类型的学习类似于人类学习的方式,从过去的经验中获取知识以用于提高解决现实问题的能力。监督学习在Web数据挖掘领域的一个成熟的应用是学习一个目标函数从而用于预测实例的类属性值。 给定一个数据集D,机器学习任务的目标就是产生一个联系属性值集合A和类标集合C的... 阅读全文

posted @ 2017-09-30 11:22 懵懂的菜鸟 阅读(667) 评论(0) 推荐(0) 编辑

规则归纳

摘要: 规则归纳 1 顺序化覆盖 大多数的规则推理系统都是使用一种叫做顺序化覆盖的算法。使用此算法的分类器维持着一组规则,叫做决策列表。 规则化覆盖的基本思想是顺序化的学习一系列的规则去覆盖训练数据。当一条规则产生以后,我们把这条规则所覆盖的所有的训练样例移除掉,然后使用剩下的训练样例继续寻找下一条规则。一条规则覆盖一个样例是指这个样例满足这条规则所描述的所有条件。 算法1 有序化的规则(Ordered ... 阅读全文

posted @ 2017-09-30 11:22 懵懂的菜鸟 阅读(1023) 评论(0) 推荐(0) 编辑

序列模式

摘要: 序列模式 1 序列模式 在Web数据挖掘中,从用户浏览网页的顺序中挖掘网站的浏览模式是很有用的;在文本挖掘中,根据词在句子中的顺序挖掘语言模式也是非常重要的。对于这些应用,序列模式挖掘发挥着重要的作用。序列模式挖掘即从序列数据库中发现频繁子序列以作为模式,它是一类重要的数据挖掘问题,有着非常广泛的应用前景,被应用在包括顾客购买行为的分析、网络访问模式分析、科学实验的分析、疾病治疗的早期诊断、自然灾... 阅读全文

posted @ 2017-09-30 11:21 懵懂的菜鸟 阅读(1113) 评论(0) 推荐(0) 编辑

关联规则

摘要: 关联规则 1 关联规则 关联规则挖掘的目的是在数据项目中找出所有的并发关系,除了基本Aprioris算法,还有一些常用的改进算法,例如多最小支持度的关联规则挖掘,分类关联规则挖掘。 Aprioris算法基于演绎原理(或称为向下封闭属性)来高效地产生所有频繁项目集。算法基于逐级搜索的思想,它采用多轮搜索的方法,每一轮搜索扫描一遍整个数据集,并最终生成所有的频繁项目集合。 多最小支持度算法简称为"MS... 阅读全文

posted @ 2017-09-30 11:20 懵懂的菜鸟 阅读(9879) 评论(0) 推荐(0) 编辑

从《数据挖掘概念与技术》到《Web数据挖掘》

摘要: 从《数据挖掘概念与技术》到《Web数据挖掘》 认真读过《数据挖掘概念与技术》的第一章后,对数据挖掘有了更加深刻的了解。数据挖掘是知识发展过程的一个步骤。知识发展的过程可以分为:数据清洗(去噪和去除不一致数据)、数据集成(多个数据源组合在一起)、数据选择(从数据库中提取和分析与任务相关的数据)、数据变换(汇总、聚集,变成统一形式)、数据挖掘(智能方法提取数据模式)、模式评估(根据兴趣度度量、识别代表... 阅读全文

posted @ 2017-09-30 11:19 懵懂的菜鸟 阅读(399) 评论(0) 推荐(0) 编辑

数据挖掘在大数据中的应用综述

摘要: 数据挖掘在大数据中的应用综述 *** (上海海事大学 上海 201306) 摘 要: 面对大规模多源异构的数据,数据挖掘的方法不断的得到改善与发展,同时对于数据挖掘体系的完善也提出了新的挑战。针对当前数据挖掘在大数据方面的应用,本文从数据挖掘的各个阶段进行了方法论的总结及应用,主要包括数据准备的方法 阅读全文

posted @ 2017-09-30 11:15 懵懂的菜鸟 阅读(4020) 评论(0) 推荐(0) 编辑

2017年9月28日 #

join sql图

摘要: SELECT * FROM TableA INNER JOIN TableB ON TableA.name = TableB.name id name id name -- -- 1 Pirate 2 Pirate 3 Ninja 4 Ninja SELECT * FROM TableA INNER 阅读全文

posted @ 2017-09-28 22:11 懵懂的菜鸟 阅读(212) 评论(0) 推荐(0) 编辑

2017年9月27日 #

数据挖掘,机器学习

摘要: 1, start() 和 run() 调用start方法方可启动线程,而run方法只是thread的一个普通方法调用,还是在主线程里执行。 2, HashMap和Hashtable的区别 HashMap和Hashtable都实现了Map接口,但决定用哪一个之前先要弄清楚它们之间的分别。主要的区别有: 阅读全文

posted @ 2017-09-27 18:10 懵懂的菜鸟 阅读(311) 评论(0) 推荐(0) 编辑

上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 34 下一页