摘要: 决策树基础概念 在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy (熵) 表示的是系统的凌乱程度,它是决策树的决策依据,熵的概念来源于香侬的信息论。 决策树的决策过程 选择分裂特征:根据某一指标(信息增益,信息增益比或基尼系数)计算不同特征的指标值,选 阅读全文
posted @ 2017-01-15 14:49 molearner 阅读(7918) 评论(0) 推荐(0) 编辑
摘要: 在用R语言做关联规则分析之前,我们先了解下关联规则的相关定义和解释。 关联规则的用途是从数据背后发现事物之间可能存在的关联或者联系,是无监督的机器学习方法,用于知识发现,而非预测。 关联规则挖掘过程主要包含两个阶段:第一阶段从资料集合中找出所有的高频项目组,第二阶段再由这些高频项目组中产生关联规则。 阅读全文
posted @ 2016-12-04 15:47 molearner 阅读(6166) 评论(1) 推荐(2) 编辑
摘要: 使用R做回归分析整体上是比较常规的一类数据分析内容,下面我们具体的了解用R语言做回归分析的过程。 首先,我们先构造一个分析的数据集 x|t|) (Intercept) 168.4453 15.2812 11.023 1.96e 09 x$var1 0.4947 0.4747 1.042 0.311 阅读全文
posted @ 2016-11-25 12:01 molearner 阅读(30570) 评论(0) 推荐(0) 编辑
摘要: 在对短期数据的预测分析中,我们经常用到时间序列中的指数平滑做数据预测,然后根据不同。 下面我们来看下具体的过程 x 阅读全文
posted @ 2016-11-24 14:04 molearner 阅读(22004) 评论(6) 推荐(0) 编辑
摘要: 在SQL的使用过程中,我们经常要做些数据备份以及定时执行的任务。 这些任务能够帮助我们简化工作过程。 下面我们了解下如何创建一个定时执行的存储过程。 首先我们要打开 SQL server 代理服务 选择计算机—— 设备管理—— 服务与应用程序—— 服务—— SQL server 代理 把SQL se 阅读全文
posted @ 2016-10-17 19:26 molearner 阅读(28841) 评论(0) 推荐(1) 编辑
摘要: 在R的使用中,为了方便提取数据, 我们经常要进行数据库进行操作,接下来我们尝试使用R进行连接数据。 这里我们使用R中的RODBC进行操作, 首先,我们需要先配置ODBC资源管理器 通过任务管理器或者win+R运行odbcad32.exe,进入odbc数据源管理器 点击添加,选择native clie 阅读全文
posted @ 2016-10-12 17:25 molearner 阅读(3232) 评论(0) 推荐(0) 编辑
摘要: 在python中时间数据类型有date(日期)和time(时间)两种数据类型。 主要用到的模块包含,datetime,time以及calendar模块。 时间类型 import datetime as dt now=dt.datetime.now() print(now) 结果为 2016 10 0 阅读全文
posted @ 2016-10-05 11:30 molearner 阅读(5363) 评论(0) 推荐(0) 编辑
摘要: 前面讲完了字符处理,但对数据进行整体性的聚合运算以及分组操作也是数据分析的重要内容。 通过数据的聚合与分组,我们能更容易的发现隐藏在数据中的规律。 数据分组 数据的分组核心思想是:拆分 组织 合并 首先,我们了解下groupby这个函数 import numpy as np import panda 阅读全文
posted @ 2016-10-04 17:14 molearner 阅读(34937) 评论(0) 推荐(0) 编辑
摘要: 在数据分析中,特别是文本分析中,字符处理需要耗费极大的精力, 因而了解字符处理对于数据分析而言,也是一项很重要的能力。 字符串处理方法 首先我们先了解下都有哪些基础方法 首先我们了解下字符串的拆分split方法 str='i like apple,i like bananer' print(str. 阅读全文
posted @ 2016-10-03 20:51 molearner 阅读(13595) 评论(0) 推荐(1) 编辑
摘要: 前面我们用pandas做了一些基本的操作,接下来进一步了解数据的操作, 数据清洗一直是数据分析中极为重要的一个环节。 数据合并 在pandas中可以通过merge对数据进行合并操作。 import numpy as np import pandas as pd data1 = pd.DataFram 阅读全文
posted @ 2016-10-03 11:13 molearner 阅读(20976) 评论(0) 推荐(0) 编辑