摘要: 目录 1 简介 在使用任何一款数据分析软件的时候,首先要做的就是数据成功的读写问题,所以不同于其他文档的书写方法,本文将探讨如何读写本地文本文件。 2 运行环境 操作系统: "Win10" R版本: "R 3.2.4 win" RStudio版本: "RStudio 0.99.896" 3 读取本地 阅读全文
posted @ 2016-08-09 23:15 稻粮谋 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 目录 "1 RMySQL" "2 环境与安装" "3 建立通信" 1 RMySQL R作为一款数据分析的工具,,而MySQL是一款常用的开源关系型数据库软件,非常适用于中小型的数据存储,当二者相互结合时才能爆发出巨大的能量。 RMySQL程序包就为R提供了访问MySQL数据库的接口程序,其不仅支持基 阅读全文
posted @ 2016-08-09 23:15 稻粮谋 阅读(2543) 评论(0) 推荐(0) 编辑
摘要: 近邻分类 简言之,就是将未标记的案例归类为与它们最近相似的、带有标记的案例所在的类。 应用领域: 1.计算机视觉:包含字符和面部识别等 2.推荐系统:推荐受众喜欢电影、美食和娱乐等 3.基因工程:识别基因数据的模式,用于发现特定的蛋白质或疾病等 K最近邻(kNN,k NearestNeighbor) 阅读全文
posted @ 2016-05-29 16:31 稻粮谋 阅读(15103) 评论(0) 推荐(1) 编辑
摘要: 对聚类进行研究是数据挖掘中的一个热门方向,由于以上所介绍的聚类方法都存在着某些缺点,因此近些年对于聚类分析的研究很多都专注于改进现有的聚类方法或者是提出一种新的聚类方法。以下将对传统聚类方法中存在的问题以及人们在这些问题上所做的努力做一个简单的总结: 1 从以上对传统的聚类分析方法所做的总结来看,不 阅读全文
posted @ 2016-05-19 22:19 稻粮谋 阅读(558) 评论(0) 推荐(0) 编辑
摘要: 单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K 近邻、支持向量机和基于关联规则的分类等;另外还有用于组合单一分类方法的集成学习算法,如Bagging和Boosting等。 1. 决策树 决策树是用于分类和预测的主要技术之一,决策树学习是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规 阅读全文
posted @ 2016-05-19 16:50 稻粮谋 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 本文是基于“融360”身价计算器测试数据以及相关结果进行的分析,用于探索目前国内个人信贷主要的影响因素。 Part 1 影响因素初步统计分析 1.就职公司类型【Company Type】 贷款额度的偏好顺序为: 公务员/事业单位 大型垄断企业 世界500强 上市公司 普通企业 结合我国社会现状,这一 阅读全文
posted @ 2016-04-28 15:11 稻粮谋 阅读(401) 评论(0) 推荐(0) 编辑
摘要: R语言中的数据结构包括标量、向量、矩阵、数组、列表以及数据框 目录 "1 向量" "2 矩阵" "3 数据框" 1 向量 向量是用于存储单一数据类型(数值、字符、逻辑值)的一维数组,示例如下: 最后将演示下R中的向量比较与运算,示例如下: R 1.向量的比较 a b 元素逐一比较 identical 阅读全文
posted @ 2016-04-23 17:58 稻粮谋 阅读(213) 评论(0) 推荐(0) 编辑