摘要: R语言与数据挖掘:公式;数据;方法R语言特征对大小写敏感通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母)。不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字。基本命令要么是表达式(expressions)要么就是 赋值(assignments)。命令可以被 (;)隔开,或者另起一行。基本命令可以通过大括弧({和}) 放在一起构成一个复合表达式(c... 阅读全文
posted @ 2016-03-23 10:25 萱草yy 阅读(133918) 评论(2) 推荐(23) 编辑
摘要: 1、ARCGIS在导入Excel坐标点的时候出现“没有注册类”的情况怎么办?确保你本机上装有office,并且版本要能够识别XLSX格式。2007以上。2、导入excel时result报错ERROR 000361: The name starts with an invalid characterFailed to execute (FeatureClassToFeatureClass).描述任何... 阅读全文
posted @ 2017-03-22 10:35 萱草yy 阅读(8414) 评论(0) 推荐(1) 编辑
摘要: 本文是对pandas官方网站上《10 Minutes to pandas》的一个简单的翻译,原文在这里。这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook 。习惯上,我们会按下面格式引入所需要的包: 一、 创建对象 可以通过 Data Structure Intro Set 阅读全文
posted @ 2016-11-03 12:47 萱草yy 阅读(988) 评论(0) 推荐(0) 编辑
摘要: 一、古典概型与几何概型1.1古典概型与几何概型特征1)共同点:等可能性(每个事件发生的概率相同)2)区别:古典概型的样本空间是一个有限集。几何概型可以是无限集,但它可以用几何区域来表示1.2公式1)古典概型:已知基本事件个数n与事件A所包含的结果数m,然后代入公式:即为事件A的概率。2)几何概型:使用有度量(长度、面积、体积等)的几何区域表示:1.3求解步骤1.3.1古典概型1)判断事件是否为等可... 阅读全文
posted @ 2016-09-06 12:44 萱草yy 阅读(1216) 评论(0) 推荐(0) 编辑
摘要: 高等代数 一、行列式 1.1求三阶行列式: 计算方法:按图计算,实线为正号,虚线为负号 1.2求n阶行列式 1)计算排列逆序数 例1:求32154的逆序数: 答:0+1+2+0+1=4 例2:求n(n-1)...21的逆序数: 答:n(n-1)/2 2)计算公式:逆序数为奇数取负,为偶数取正。 注意 阅读全文
posted @ 2016-09-06 12:42 萱草yy 阅读(1556) 评论(0) 推荐(0) 编辑
摘要: 一、赛题介绍1、赛题数据:已知x个歌曲艺人在阿里音乐上的用户记录数据(2015年03月01日-2015年08月30日)用户行为表:一行记录某个用户某日对某首歌曲的操作,包括:播放,下载,收藏歌曲艺人表:一行记录某个艺人在某日发行某首歌曲的基本信息,其中包括该收歌曲的专辑收录时间,初始播放量,歌唱语言以及歌唱者的性别组成预测这x个艺人在之后的2个月(2015年09月01日-2015年10月30日),... 阅读全文
posted @ 2016-08-30 17:08 萱草yy 阅读(5893) 评论(8) 推荐(1) 编辑
摘要: 根据小结1,用复赛数据对艺人分类为高播放量(前23名)艺人和低播放量艺人:以08均值最高的艺人1b322374de83520bf45aa8928e18e70a为研究对象选择7、8月画出时序图,除了7月初(7月7日)前,之后基本是平稳的。 按每周7天计算每月平均播放量如下,可以发现这个分布规律与工作节假日规律相关 根据之前金陵书生提供的听歌年龄分布,大概在25到31岁所占比重最大,这类人大部分是上... 阅读全文
posted @ 2016-08-30 16:55 萱草yy 阅读(600) 评论(0) 推荐(0) 编辑
摘要: 分类艺人:选取08月总值较高的14个艺人作为研究对象用户:根据袁光浩PPT中对第11个线路画的每个用户刷卡次数的统计表我们以用户user_id=b15e8846dc61824c1242a6b36796117b(播放量最高的艺人)为例,画出该艺人的用户183的播放量图像:(127135*0.995=126499.3)如下是将用户总小到大取前126499个用户的图像:横轴是用户按播放量从小到大的编号,... 阅读全文
posted @ 2016-08-30 11:21 萱草yy 阅读(840) 评论(0) 推荐(0) 编辑
摘要: 第一章1定义:数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。2目的:把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。3分类:数据分析可划分为描述性数据分析,探索性数据分析和验证性数据分析。描述性分析是日常工作中主要的数据分析,有对比分析法、平均分析法、交叉分析法。而探索性数据分析以及验证性数据分析属于高级数据分析,常见的方法有相关分... 阅读全文
posted @ 2016-08-29 09:35 萱草yy 阅读(13527) 评论(0) 推荐(0) 编辑
摘要: 第1章:数据处理技巧案例1:数据:6,0000条不明飞行物(UFO)的目击纪录和报道。主要目击纪录发生在美国。问题:面对这份数据的时空维度,我们可能会有以下疑问:UFO的出现是否有周期性规律?美国的不同州出现的UFO记录如果有区别,有哪些区别?主要内容:日期的处理字符串地名的处理主要函数:#读入“\t”制表符数据,并设置列名称read.delim(" ", sep="\t", stringAsFa... 阅读全文
posted @ 2016-08-29 09:27 萱草yy 阅读(5163) 评论(0) 推荐(0) 编辑
摘要: 笔记:一、检验:1、平稳性检验:图检验方法: 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列 自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0(指数级衰减),反之非平稳序列衰减速度会比较慢 构造检验统计量进行假设检验:单位根检验adfTest()——fUnitRoots包2、纯随机性检验、白噪声检验(Box.t... 阅读全文
posted @ 2016-08-29 09:21 萱草yy 阅读(14436) 评论(0) 推荐(1) 编辑