随笔 - 402  文章 - 1 评论 - 20 阅读 - 113万
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

随笔分类 -  Data Mining,Machine learning

上一页 1 2
Data Mining,Machine learning
数据挖掘必备知识总结
摘要:平台:linux(Shell)软件:R,SAS,Spss,weka,IBM IM,Mathout语言:Java,Python,PHP,MapReduce编程,Ruby数据库:SQL,MySQL算法:数据挖掘\机器学习算法备注:(C4.5(分类决策树)、 k-mean... 阅读全文
posted @ 2015-06-04 22:39 chamie 阅读(508) 评论(0) 推荐(0) 编辑
遗传算法
摘要:1 基本概念 遗传算法(GA)的概念是由Holland于1973年受生物进化论的启发而首次提出的。它是一种通过模拟生物界自然选择和遗传机制的随机搜索算法。 遗传算法基本思想是模拟自然界优胜劣汰的进化现象,把搜索空间映射为遗传空间,把可能的解编码成一个向量——染色体,向量的每个元素称为基因。 通过... 阅读全文
posted @ 2015-06-04 15:53 chamie 阅读(13867) 评论(0) 推荐(0) 编辑
聚类分析
摘要:聚类(clustering)就是将数据集划分为由若干相似实例组成的簇(cluster)的过程,使得同一个簇中实例间的相似度最大化,不同簇的实例间的相似度最小化。聚类分析的方法主要有: 1)划分的方法 2)层次的方法 3)基于密度的方法 4)基于网格的方法 5)基于模型的方法 。。。 w... 阅读全文
posted @ 2015-06-04 14:53 chamie 阅读(306) 评论(0) 推荐(0) 编辑
数据预处理
摘要:数据预处理是数据挖掘的重要步骤,数据挖掘者的大部分时间和经历都要花在预处理阶段。数据预处理涉及的策略和技术非常广泛,主要包括如下技术:1)聚集 聚集(Aggregation)就是将两个或多个对象合并为单个对象。一般来说,定量数据通常通过求和或求平均值进行聚集,定性数据通常通过汇总进行聚集。聚集可能... 阅读全文
posted @ 2015-06-04 13:56 chamie 阅读(322) 评论(0) 推荐(0) 编辑
机器学习--有监督学习和无监督学习
摘要:1、数据挖掘与机器学习的关系 数据挖掘和机器学习这两项技术的关系非常密切。 机器学习方法构成数据挖掘的核心,绝大多数数据挖掘技术都来自机器学习领域,数据挖掘又向机器学习提出新的要求和任务。2、数据挖掘与机器学习的概念 数据挖掘就是在数据中寻找模式的过程,这个寻找过程必须是自动的或半自动的,并且... 阅读全文
posted @ 2015-06-04 13:46 chamie 阅读(1160) 评论(0) 推荐(0) 编辑
关联规则
摘要:1、背景 1993年,Agrawal提出了关联规则(Association Rule)问题,旨在发现顾客购货篮内商品间令人感兴趣的关系。 “啤酒和尿布” 沃尔玛利用NCR数据挖掘工具意外的发现:跟尿布一起购买最多的商品竟是啤酒! 今天,关联规则已广泛应用于金融、营销以及生物信息学等领域。2... 阅读全文
posted @ 2015-05-27 12:07 chamie 阅读(2583) 评论(0) 推荐(0) 编辑
决策树J48算法
摘要:1、J48原理 基于从上到下的策略,递归的分治策略,选择某个属性放置在根节点,为每个可能的属性值产生一个分支,将实例分成多个子集,每个子集对应一个根节点的分支,然后在每个分支上递归地重复这个过程。当所有实例有相同的分类时,停止。 问题:如何选择根节点属性,建立分支呢? 例如:weather.a... 阅读全文
posted @ 2015-05-23 12:45 chamie 阅读(16072) 评论(0) 推荐(0) 编辑
数据分析方法汇总
摘要:一、描述统计描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法。2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K... 阅读全文
posted @ 2015-05-11 22:21 chamie 阅读(986) 评论(0) 推荐(1) 编辑
分类
摘要:1定义是指把数据样本映射到一个事先定义的类中的学习过程;即给定一组输入的属性向量及其对应的类,用基于归纳的学习算法得出分类所以数据分类的任务:通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y; 2示例 数据集包含多个描述属性和一个类别属性,一般来数,描述属性:连续值或离散值... 阅读全文
posted @ 2015-04-25 23:38 chamie 阅读(511) 评论(0) 推荐(0) 编辑
贝叶斯分类器(Bayes分类器)
摘要:贝叶斯(Bayes)定理 (条件概率)贝叶斯分类器(Bayes分类器) 1概念:将每个属性及类别标记视为随机变量给定一个具有属性集合(A1, A2,…,An)的记录目标是预测类别属性C具体而言,要寻找使得P(C| A1, A2,…,An )最大的类别C。 2方法:利用Bayes定理计算所有类别C的... 阅读全文
posted @ 2015-04-23 15:41 chamie 阅读(456) 评论(0) 推荐(0) 编辑

上一页 1 2
点击右上角即可分享
微信分享提示