R语言相关数据集
如何使用R内置的数据集
R在datasets包中提供了100多个可以使用的数据集|通过data()函数加载入内存
data()
dim(data()$results)
data()$results
data()$results[,4]
向量
-
rivers #北美141条河流长度
-
state.abb #美国50个州的双字母缩写
-
state.area #美国50个州的面积
-
state.name #美国50个州的全称
-
euro #欧元汇率,长度为11,每个元素都有命名
-
landmasses #48个陆地的面积,每个都有命名
-
precip #长度为70的命名向量
因子
-
state.region #美国50个州的地理分类
-
state.division #美国50个州的分类,9个类别
矩阵、数组
-
crimtab #3000个男性罪犯左手中指长度和身高关系
-
HairEyeColor #592人头发颜色、眼睛颜色和性别的频数
-
occupatimnalStatus #英国男性父子职业联系
-
euro.cross #11种货币的汇率矩阵
-
freeny.x #每个季度影响收入四个因素的记录
-
state.x77 #美国50个州的八个指标
-
USPersonalExpenditure #5个年份在5个消费方向的数据
-
VADeaths #1940年弗吉尼亚州死亡率(每千人)
-
volcano #某火山区的地理信息(10米×10米的网格)
-
WorldPhones #8个区域在7个年份的电话总数
-
iris3 #3种鸢尾花形态数据
-
Titanic #泰坦尼克乘员统计
-
UCBAdmissions #伯克利分校1973年院系、录取和性别的频数
类矩阵
-
Harman74.cor #145个儿童24个心理指标的相关系数矩阵
-
eurodist #欧洲12个城市的距离矩阵,只有下三角部分
-
Harman23.cor #305个女孩八个形态指标的相关系数矩阵
数据框
-
BOD #随水质的提高,生化反应对氧的需求(mg/l)随时间(天)的变化
-
cars #1920年代汽车速度对刹车距离的影响
-
chickwts #不同饮食种类对小鸡生长速度的影响
-
esoph #法国的一个食管癌病例对照研究
-
faithful #一个间歇泉的爆发时间和持续时间
-
Formaldehyde #两种方法测定甲醛浓度时分光光度计的读数
-
Freeny #每季度收入和其他四因素的记录
-
dating from #配对的病例对照数据,用于条件logistic回归
-
InsectSprays #使用不同杀虫剂时昆虫数目
-
iris #3种鸢尾花形态数据
-
LifeCycleSavings #50个国家的存款率
-
longley #强共线性的宏观经济数据
-
morley #光速测量试验数据
-
mtcars #32辆汽车在11个指标上的数据
-
OrchardSprays #使用拉丁方设计研究不同喷雾剂对蜜蜂的影响
-
PlantGrowth #三种处理方式对植物产量的影响
-
airquality #纽约1973年5-9月每日空气质量
-
anscombe #四组x-y数据,虽有相似的统计量,但实际数据差别较大
-
attenu #多个观测站对加利福尼亚23次地震的观测数据
-
attitude #30个部门在七个方面的调查结果,调查结果是同一部门35个职员赞成的百分比
-
beaver1 #一只海狸每10分钟的体温数据,共114条数据
-
beaver2 #另一只海狸每10分钟的体温数据,共100条数据
类数据框
-
Indometh #某药物的药物动力学数据
-
Loblolly #火炬松的高度、年龄和种源
-
Orange #桔子树生长数据
-
Theoph #茶碱药动学数据
-
ChickWeight #饮食对鸡生长的影响
-
CO2 #耐寒植物CO2摄取的差异
-
DNase #若干次试验中,DNase浓度和光密度的关系
时间序列数据
-
freeny.y #每季度收入
-
JohnsonJohnson #1960-1980年每季度Johnson Johnson股票的红利
-
LakeHuron #1875-1972年某一湖泊水位的记录
-
lh #黄体生成素水平,10分钟测量一次
-
lynx #1821-1934年加拿大猞猁数据
-
nhtemp #1912-1971年每年平均温度
-
Nile #1871-1970尼罗河流量
-
nottem #1920-1939每月大气温度
-
presidents #1945-1974年每季度美国总统支持率
-
UKDriverDeaths #1969-1984年每月英国司机死亡或严重伤害的数目
-
sunspot.month #1749-1997每月太阳黑子数
-
sunspot.year #1700-1988每年太阳黑子数
-
sunspots #1749-1983每月太阳黑子数
-
treering #归一化的树木年轮数据
-
UKgas #1960-1986每月英国天然气消耗
-
USAccDeaths #1973-1978美国每月意外死亡人数
-
uspop #1790–1970美国每十年一次的人口总数(百万为单位)
-
WWWusage #每分钟网络连接数
-
Seatbelts #多变量时间序列。和UKDriverDeaths时间段相同,反映更多因素。
-
EuStockMarkets #多变量时间序列。欧洲股市四个主要指标的每个工作日记录,共1860条记录。
-
airmiles #美国1937-1960年客运里程营收(实际售出机位乘以飞行哩数)
-
AirPassengers #Box & Jenkins航空公司1949-1960年每月国际航线乘客数
-
austres #澳大利亚1971-1994每季度人口数(以千为单位)
-
BJsales #有关销售的一个时间序列
-
BJsales.lead #前一指标的先行指标(leading indicator)
-
co2 #1959-1997年每月大气co2浓度(ppm)
-
discoveries #1860-1959年每年巨大发现或发明的个数
-
ldeaths #1974-1979年英国每月支气管炎、肺气肿和哮喘的死亡率
-
fdeaths #前述死亡率的女性部分
-
mdeaths #前述死亡率的男性部分
©哈尔滨商业大学 银河统计工作室
银河统计工作室成员由在校统计、计算机部分师生和企业数据数据分析师组成,维护和开发银河统计网和银河统计博客(技术文档)。专注于数据挖掘技术研究和运用,探索统计学、应用数学和IT技术有机结合,尝试大数据条件下新型统计学教学模式。