R语言入门与数据分析
课程介绍
R是免费的,R是一个全面的统计研究平台,提供了各式各样的数据分析技术,R拥有顶尖的绘图功能
1-9 数据分析的内容,学习R的目的
10-15 R的基本操作
16-17 R的数据结构和操作,最基础最重要
28-33 R对文件的操作
数据分析
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质,状态以及相互关系等进行记载的物理符号或这些物理符号的组合
进行数据分析是为了通过数据分析的结果来指导决策
数据分析的过程:数据采集,数据存储,数据分析,数据挖掘,数据可视化,进行决策
数据采集的数据称为元数据
数据统计:使用统计方法,有目的的对收集到的数据进行分析处理,并解读分析结果
数据挖掘:一般是指从大量的数据中通过算法搜素隐藏于其中信息的过程
均值,中位数,极差,方差,标准差,偏度,峰度,出现最频繁的数
数据挖掘
数据与三个重大的思维转变:
- 要分析与某事物相关的所有数据而不是依靠分析少量的数据样本
- 我们乐于接收数据的纷繁复杂,而不再追求精确性
- 不再探求难以捉摸的因果关系,转而关注事物的相关关系
数据可视化
R语言介绍
R是S语言的一种实现。S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由 MathSoft公司的统计科学部进一步完善。后来Auckland大学的 RobertGentleman 和 Ross lhaka 及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处,两个软件有一定的兼容性。
- 有效的数据处理和保存机制。
- 拥有一整套数组和矩阵的操作运算符。
- 一系列连贯而又完整的数据分析中间工具
- 图形统计可以对数据直接进行分析和显示,可用于多种图形设备
- 一种相当完善、简洁和高效的程序设计语言。
- R语言是彻底面向对象的统计编程语言。
- R语言和其它编程语言、数据库之间有很好的接口,
- R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差。
- R语言具有丰富的网上资源。
1、R软件不够规范,不容易上手,需要付出较多的努力,付出大量的学习成本;
2、R扩展包,太多了,需要利用较多的时间查找和学习
R可以进行计算,绘图,也是一个编程语言,
r-project.org
举个例子
R软件的安装
2024年4月20日18:54:24