上一页 1 2 3 4 5 6 7 8 ··· 13 下一页
摘要: 首先写第二部分的前言。第二部分用来介绍获取数据基本信息的图形技术和统计方法。本章主要内容条形图、箱型图、点图饼图和扇形图直方图和核密度图分析数据第一步就是要观察它,用可视化的方式是最好的。本章的主题有两个1、将变量的分布作可视化展示2、通过结果变量进行跨组比较下面从不同的图形开始探索数据。6.1条形... 阅读全文
posted @ 2015-08-16 00:50 司空格子Ored 阅读(2100) 评论(0) 推荐(0) 编辑
摘要: 本章内容:数学和统计函数字符处理函数循环和条件执行自编函数数据整合与重塑5.1一个数据处理难题5.2数值和字符处理函数分为数值函数和字符串函数,下面是数学函数截图:ceiling、floor、trunc、signif函数第一次听说,是一些数位函数的处理函数。注意log是以e为底的。当上面的函数用在向... 阅读全文
posted @ 2015-08-14 16:01 司空格子Ored 阅读(1770) 评论(0) 推荐(0) 编辑
摘要: 本章内容:操纵日期和缺失值熟悉数据类型的转换变量的创建和重编码数据集的排序,合并与取子集选入和丢弃变量多说一句,数据预处理的时间是最长的……确实是这样的,额。4.1一个示例4.2创建新变量算术运算符:+、-、*、/、^(**)(求幂)、x %% y(取余运算)、x %/% y(整数除法)。trans... 阅读全文
posted @ 2015-08-11 00:28 司空格子Ored 阅读(949) 评论(0) 推荐(0) 编辑
摘要: 3.4添加文本、自定义坐标轴和图例很多作图函数可以设置坐标轴和文本标注。比如标题、副标题、坐标轴标签、坐标轴范围等。需要注意的是并不是所有的绘图函数都有上述的参数,需要进行验证。可以将一些默认的参数进行移除,用ann = FALSE来操作。3.4.1标题title函数。title(main = NU... 阅读全文
posted @ 2015-08-09 19:22 司空格子Ored 阅读(1015) 评论(0) 推荐(0) 编辑
摘要: 3.1使用图形可以使用pdf等函数将图形直接保存在文件中。在运用attach和detach函数的使用中经常出现错误,比如命名重复的问题,所以,应该尽量避免使用这两个函数。plot是一般的画图函数,hist是直方图,boxplot是箱型图。这些函数会覆盖前面的图形,如何创建多个图形便于同时查看呢?方法... 阅读全文
posted @ 2015-08-09 16:37 司空格子Ored 阅读(972) 评论(0) 推荐(0) 编辑
摘要: 2.1数据集的概念变量的类型是不同的,比如标示符、日期变量、连续变量、名义变量、有序型变量等,记得数据挖掘导论中有专门的描述。R可以处理的数据类型包括了数值型、字符型、逻辑型、复数型(虚数)、原生型(字节)。2.2数据结构R拥有很多存储数据的对象类型,包括 标量、向量、矩阵、数组、数据框、列表。它们... 阅读全文
posted @ 2015-08-04 16:58 司空格子Ored 阅读(5121) 评论(0) 推荐(0) 编辑
摘要: 1、典型的数据分析过程可以总结为一下图形:注意,在模型建立和验证的过程中,可能需要重新进行数据清理和模型建立。2、R语言一般用 也可以。3、age <- c(1,3,5,2,11,9,3,9,12,3)weight <- c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2... 阅读全文
posted @ 2015-07-31 20:45 司空格子Ored 阅读(1942) 评论(1) 推荐(0) 编辑
摘要: 本人最近在某咨询公司实习,涉及到了一些数据分析的工作,用的是R语言来处理数据。但是在应用的过程中,发现用R很不熟练,所以再打算学一遍R。曾经花一个月的时间看过一遍《R语言编程艺术》,还用R做过阿里的推荐算法比赛,对R语言有一些最初级、基本的了解。不过 ,上面那本书虽然挺好,但是不适合速成,是从程序员... 阅读全文
posted @ 2015-07-31 18:39 司空格子Ored 阅读(513) 评论(0) 推荐(0) 编辑
摘要: 第一章思考题1-1(运行时间的比较)确定时间t内求解的问题的最大规模。上面是网上提供的答案。注意点:1、最左边一列的是关于n的增长情况描述,值得记住的是这些增长的排列顺序,这是非常有用的,啊,数分学好了会很容易;2、注意1s内能处理的以n为增长量级的规模是10的6次方,记住这个结果可以推导出其他增长... 阅读全文
posted @ 2015-07-17 16:08 司空格子Ored 阅读(1422) 评论(0) 推荐(0) 编辑
摘要: 我们可以使用的算法设计技术有很多。插入排序用的是增量方法,即在已经排好的数组中不断加入新的元素。下面考虑一种被称为“分治法”的设计方法。2.3.1分治法分治法的思想:将原问题分解为几个规模较小但是类似于原问题的子问题,递归地求解这些子问题,然后合并这些子问题的解来建立原问题的解。分治模式在每层递归时... 阅读全文
posted @ 2015-07-17 12:04 司空格子Ored 阅读(434) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 13 下一页