常用于mutate()创建变量时的基础运算与函数
x/sum() 计算x各个分量在总数中的比例
y-mean(y) 计算y各分量与均值之间的差异
%/% 整除
%%求余数
注:当一个向量中的值不够用时,这个向量会被循环使用。如1:3+1:10等价于c(1 + 1, 2 + 2, 3 + 3, 1 + 4, 2 + 5, 3 + 6, 1 + 7, 2 + 8, 3 + 9, 1 + 10)
log2()更多,log10()也有
偏移函数 ,默认是移动一个单位
- lead() 向量向前移动指定单位
- lag() 向量向后移动指定单位
累加,滚动聚合cum*,cumulative
- cumsum() 累加和
- cumprod() 累加积
- cummax() 累加最大值
- cummin() 累加最小值
- cummean()累加平均值
排秩
- min_rank(x) 默认最小的值获得最前面的秩(升序),
- min_rank(desc(x)) 最大的值获得最前面的名次
- NA值对应的秩是NA
- n个相同值赋予1个相同的秩,下一个值的秩会直接从x+n开始
- row_number() 相同值不同秩
- dense_rank(x) 相同值的秩相同,但下一个值的秩不跳转。
- percent_rank() 将秩按比例压缩到[0,1]的值
- ntile() 将向量分为n等份。
-
本文来自博客园,作者:BioinformaticsMaster,转载请注明原文链接:https://www.cnblogs.com/koujiaodahan/p/15688358.html
posted on 2021-12-14 15:57 BioinformaticsMaster 阅读(146) 评论(0) 编辑 收藏 举报
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2017-12-14 python zip()函数转置表,操作列