数据排序

数据排序

1、sort()，rank()，order()函数

Sort	排序（默认升序，decreasing=T时为降序）
Order	排序（默认升序，decreasing=T时为降序）

在R中，和排序相关的函数主要有三个：sort()，rank()，order()。

sort(x)是对向量x进行排序，返回值排序后的数值向量。rank()是求秩的函数，它的返回值是这个向量中对应元素的“排名”。而order()的返回值是对应“排名”的元素所在向量中的位置。

下面以一小段R代码来举例说明：

[plain] view plain copy

x<-c(97,93,85,74,32,100,99,67)
sort(x)
[1] 32 67 74 85 93 97 99 100
order(x) #order()的返回值是各个排名的学生成绩所在向量中的位置
[1] 5 8 4 3 2 1 7 6
rank(x) #rank()的返回值是这组学生所对应的排名
[1] 6 5 4 3 1 8 7 2

深入理解一下:

sort（）在单变量排序中，效果较好；

order()≈原序号(sort()) 因为可以标记排序好之后的下标，在数据框中的排序操作，实用性超强，可以实现：

1、整个数据集按照某个变量（比如：按月份大小）排序；

2、整个数据集其中某个变量依据第二个变量（比如：月份）排序。

[plain] view plain copy

iris;iris[1:10,]
names(iris)
#单数据列，两者相同
sort(iris$Sepal.Length)
iris$Sepal.Length[order(iris$Sepal.Length)]
#多数据列，order有奇效
iris[order(iris$setosa),] #按照setosa的大小，重排整个数据集
iris$Sepal.Length[order(iris$setosa)] #按照照setosa的大小，重排Sepal.Length数据列
iris[order(iris$setosa),]$Sepal.Length #与上句异曲同工

与which有一些地方的相似，which可以实现返回服从条件观测的行数。which又与subset子集筛选有关。（详见which、subset子集筛选用法）

[plain] view plain copy

data$V1[which(data$V2<0)] #筛选出V1中，V2小于0的数字，跟order的作用些许相似
#order用法
iris$Sepal.Length[order(iris$setosa)] #按照照setosa的大小，重排Sepal.Length数据列

2、dplyr包的一些应用

[plain] view plain copy

#dplyr中基本函数 arrange——数据排序
Hdma_dat[order(Hdma_dat$survived),] #传统方法用order排序
arrange(Hdma_dat,survived) #将survived从小到大排序
arrange(Hdma_dat,desc(survived) #将survived从大到小排序
arrange(Hdma_dat,pclass,desc(survived) #先将pclass从小到大排序，再在那个数据基础上让survived从大到小排序

posted @ 2017-04-07 10:43 holy_black_cat 阅读(385) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 10年+ .NET Coder 心语，封装的思维：从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热？
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列：向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

公告

昵称： holy_black_cat
园龄： 8年7个月
粉丝： 27
关注： 3

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:R语言中的字符串处理函数
写的非常详细，感谢
请问，sprintf函数里面，%g，%G代替的是什么啊
--大表哥救救我
2. Re:通过 Spark R 操作 Hive
赤裸裸的，一字不漏的抄袭！原文链接至少放一下吧！
--Logos
3. Re:r 数据分组处理
@ 136247建议看一下dplyr包，将循环转化为groupby和summary结构。r里面的循环太耗资源，大数据量级基本废了。我随笔里有这个包的介绍，你自己找一下...
--holy_black_cat
4. Re:r 数据分组处理
请问博主，如果对于很多年龄进行分组该如何使用类似这样的函数？staff$over25 <- ifelse(staff$age > 25, 1, 0) 比如将年龄分为0-14,15-24,25-34,3...
--136247