随笔分类 -  R

摘要:一、函数用途 将文件夹中的文件名存到列表当中,可以用于批量导入文件 二、函数参数 list.files(path = ".", pattern = NULL, all.files = FALSE, full.names = FALSE, recursive = FALSE, ignore.case 阅读全文
posted @ 2020-03-31 08:24 nkwy2012 阅读(1251) 评论(0) 推荐(0) 编辑
摘要:.zip压缩:zip()解压:unzip()若要压缩文件,就直接在 zip() 函数的第一个参数里面输入压缩后的文件名,第二个参数输入压缩前的文件名。 而解压文件就更简单了,直接利用 unzip() 里面加上需要解压的文件名称即可。 .tar.gz压缩:tar()解压:untar()同 .zip 后 阅读全文
posted @ 2020-03-30 17:09 nkwy2012 阅读(5710) 评论(0) 推荐(0) 编辑
摘要:在R语言进行数据分析时,经常需要找不同组间的相同和不同,那你应该掌握如下几个函数,让你事半功倍。 交集intersect两个向量的交集,集合可以是数字、字符串等 # 两个数值向量取交集intersect(x=1:4, y = 2:6)# [1] 2 3 4 # 两个字符向量取交集intersect( 阅读全文
posted @ 2018-12-20 08:05 nkwy2012 阅读(5999) 评论(0) 推荐(1) 编辑
摘要:数据的清理 如同列夫托尔斯泰所说的那样:“幸福的家庭都是相似的,不幸的家庭各有各的不幸”,糟糕的恶心的数据各有各的糟糕之处,好的数据集都是相似的。一份好的,干净而整洁的数据至少包括以下几个要素: 1、每一个观测变量构成一列 2、每一个观测对象构成一行 3、每一个类型的观测单元构成一个表 就像我们最常 阅读全文
posted @ 2018-12-17 00:40 nkwy2012 阅读(1059) 评论(0) 推荐(0) 编辑
摘要:环境设置函数为options(),用options()命令可以设置一些环境变量,使用help(options)可以查看详细的参数信息。 1. 数字位数的设置,options(digits=n),n一般默认情况下是7位,但实际上的范围是1~22,可以随意设置位数。 2. 扩展包的安装,使用下面的命令, 阅读全文
posted @ 2018-10-26 06:20 nkwy2012 阅读(4438) 评论(0) 推荐(0) 编辑
摘要:1 安装工具Bioc的软件包不能使用直接install.packages函数,它有自己的安装工具,使用下面的代码: source("https://bioconductor.org/biocLite.R")biocLite() 上面第二个语句将安装Bioconductor一些基础软件包,包括Bioc 阅读全文
posted @ 2018-10-26 06:12 nkwy2012 阅读(1979) 评论(0) 推荐(0) 编辑
摘要:问题1:如何设置默认镜像 你希望下载某些R包,因此希望设定默认的CRAN网站镜像,这样R每次下载时不需要你选择镜像。 解决方案 该方案要求用户R系统中包含一个.Rprofile文件,如方法3.16描述的那样: 1.调用chooseCRANmirror函数: chooseCRANmirror() R会 阅读全文
posted @ 2018-10-26 06:02 nkwy2012 阅读(2907) 评论(0) 推荐(0) 编辑
摘要:https://cran.r-project.org/web/views/Graphics.html CRAN Task View: Graphic Displays & Dynamic Graphics & Graphic Devices & Visualization R is rich wit 阅读全文
posted @ 2018-07-16 10:14 nkwy2012 阅读(253) 评论(0) 推荐(0) 编辑
摘要:http://www.bioconductor.org/packages/release/bioc/vignettes/trackViewer/inst/doc/trackViewer.html Abstract Visualize mapped reads along with annotatio 阅读全文
posted @ 2018-07-12 08:10 nkwy2012 阅读(3340) 评论(0) 推荐(0) 编辑
摘要:https://www.cnblogs.com/nxld/p/6059603.html 分析数据要做的第一件事情,就是观察它。对于每个变量,哪些值是最常见的?值域是大是小?是否有异常观测? ggplot2图形之基本语法: ggplot2的核心理念是将绘图与数据分离,数据相关的绘图与数据无关的绘图分离 阅读全文
posted @ 2018-07-05 11:43 nkwy2012 阅读(1709) 评论(0) 推荐(0) 编辑
摘要:在作图过程中,有时我们可能需要通过添加一些线条,使得图形的可视化变得更好,比如一些趋势线等等。 下面我们来看下,一些线条的添加方式。 geom_abline(mapping = NULL, data = NULL, ..., slope, intercept, na.rm = FALSE, show 阅读全文
posted @ 2018-07-05 11:37 nkwy2012 阅读(4189) 评论(0) 推荐(0) 编辑
摘要:https://www.jianshu.com/p/b7274afff14f?from=timeline #先加载包 library(ggpubr) #加载数据集ToothGrowth data("ToothGrowth") head(ToothGrowth) ## len supp dose ## 阅读全文
posted @ 2018-07-03 17:49 nkwy2012 阅读(4925) 评论(0) 推荐(0) 编辑
摘要:转载:https://www.jianshu.com/p/678213d605a5?from=jiantop.com Hadley Wickham创建的可视化包ggplot2可以流畅地进行优美的可视化,但是如果要通过ggplot2定制一套图形,尤其是适用于杂志期刊等出版物的图形,对于那些没有深入了解 阅读全文
posted @ 2018-07-02 08:23 nkwy2012 阅读(2957) 评论(0) 推荐(0) 编辑
摘要:转载生信技能树 https://mp.weixin.qq.com/s/JB_329LCWqo5dY6MLawfEA TCGA数据源 - R包RTCGA的简单介绍 - 首先安装及加载包 - 指定任意基因从任意癌症里面获取芯片表达数据 - 绘制指定基因在不同癌症的表达量区别boxplot - 更多box 阅读全文
posted @ 2018-07-02 08:12 nkwy2012 阅读(11731) 评论(0) 推荐(0) 编辑
摘要:生存分析与R 生存分析是将事件的结果和出现这一结果所经历的时间结合起来分析的一类统计分析方法。不仅考虑事件是否出现,而且还考虑事件出现的时间长短,因此这类方法也被称为事件时间分析(time-to-event analysis)。生存分析是医学领域中一个重要的内容,在肿瘤等疾病的研究中运用十分广泛。 阅读全文
posted @ 2018-06-29 08:44 nkwy2012 阅读(1599) 评论(0) 推荐(0) 编辑
摘要:什么是置信区间 置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。 置信区间的概述 1、对于具有特定的发生概率的随机变量,其特定的价值区间:一个确定的数值范围(“一个区间”)。 2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信 阅读全文
posted @ 2018-06-28 16:56 nkwy2012 阅读(32085) 评论(0) 推荐(0) 编辑
摘要:生存分析指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析或存活率分析。常用于肿瘤等疾病的标志物筛选、疗效及预后的考核。 简单地说,比较两组或多组人群随着时间的延续,存活个体的比例变化趋势。活着的个体越少的组危险性越 阅读全文
posted @ 2018-06-28 15:54 nkwy2012 阅读(967) 评论(0) 推荐(0) 编辑
摘要:1、背景简介 在数据分析工作中,经常需要对原始的数据集进行清洗、整理以及变换。常用的数据整理与变换工作主要包括:特定分析变量的选取、满足条件的数据记录的筛选、按某一个或几个变量排序、对原始变量进行加工处理并生成新的变量、对数据进行汇总以及分组汇总,比如计算各组的平均值等。 其实,上述的数据处理与变换 阅读全文
posted @ 2018-06-28 08:47 nkwy2012 阅读(751) 评论(0) 推荐(0) 编辑
摘要:当我们想研究不同sample的某个变量A之间的差异时,往往会因为其它一些变量B对该变量的固有影响,而影响不同sample变量A的比较,这个时候需要对sample变量A进行标准化之后才能进行比较。标准化的方法是对sample 的 A变量和B变量进行loess回归,拟合变量A关于变量B的函数 f(b), 阅读全文
posted @ 2018-06-26 19:36 nkwy2012 阅读(939) 评论(0) 推荐(1) 编辑
摘要:本文链接地址 http://quqiuzhu.com/2016/python-multiprocessing/ Python 解释器有一个全局解释器锁(PIL),导致每个 Python 进程中最多同时运行一个线程,因此 Python 多线程程序并不能改善程序性能,不能发挥多核系统的优势,可以通过这篇 阅读全文
posted @ 2018-05-22 15:58 nkwy2012 阅读(195) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示