教小高改bug

  博客园 :: 首页 :: 博问 :: 闪存 :: :: 联系 :: :: 管理 ::

2022年10月4日

摘要: 1. 散点图和箱线图的差别: 箱线图就是散点图把横坐标弱化的结果。弱化个体的概念,强化群体的概念,把同一个分组放到一起,就形成了箱线图。 箱线图的输入数据是一个数值型向量和一个字符串向量(重复值) 2. 箱线图: 3. 箱线图的作用: 单个基因在两组之间的表达量差异。如果是多个基因,则需要量化指标: 阅读全文
posted @ 2022-10-04 21:48 小高不高 阅读(753) 评论(0) 推荐(0) 编辑

摘要: 数据降维 在进行数据挖掘或者机器学习时,我们面临的数据往往是高维数据。相较于低维数据,高维数据为我们提供了更多的信息和细节,也更好的描述了样本;但同时,很多高效且准确的分析方法也将无法使用。处理高维数据和高维数据可视化是数据科学家们必不可少的技能。解决这个问题的方法便是降低数据的维度。在数据降维时, 阅读全文
posted @ 2022-10-04 21:46 小高不高 阅读(2046) 评论(0) 推荐(2) 编辑

2022年10月3日

摘要: 1. 散点图的用途 散点图是用两组数据构成多个坐标点,观察坐标点的分布,判断两者之间是否存在某种关联或总结坐标点的分布模式。 从散点图上可以解读两个变量的相互关系,所以一般用于做相关性分析。 2. 什么是相关性分析 对两个或多个具备相关性的变量元素进行分析,从而衡量两个因素的的相关密切程度。通常用来 阅读全文
posted @ 2022-10-03 20:42 小高不高 阅读(8070) 评论(0) 推荐(0) 编辑

摘要: 1. 火山图的用途 主要是展示差异表达的基因,通常应用于转录组研究,也能应用于基因组,蛋白质组,代谢组等统计数据。 2. 怎么看火山图 1)坐标轴: 横轴是log2(Fold change),显示差异倍数(FC),点越偏离中心,表示差异倍数越大; 纵轴是-log 10 (adj. p-value), 阅读全文
posted @ 2022-10-03 20:42 小高不高 阅读(1448) 评论(0) 推荐(0) 编辑

摘要: 1. 是什么热图 热图是对实验数据分布情况进行分析的直观可视化方法,可以用来进行实验数据的质量控制和差异数据的具像化展示。 其基本原则是用颜色代表数字,让数据呈现更直观、对比更明显。还可以对数据和样本进行聚类,观测样品质量。 热图有多种形式,但基本的元素是一致的。 例如上图中的2张热图,每个格子表示 阅读全文
posted @ 2022-10-03 20:42 小高不高 阅读(945) 评论(0) 推荐(0) 编辑

2022年9月30日

摘要: limma,edgeR,DESeq2三大包基本是做转录组差异分析的金标准,大多数转录组的文章都是用这三个R包进行差异分析。edgeR差异分析速度快,得到的基因数目比较多,假阳性高(实际不差异结果差异)。DESeq2差异分析速度慢,得到的基因数目比较少,假阴性高(实际差异结果不差异)。 需要注意的是制 阅读全文
posted @ 2022-09-30 22:22 小高不高 阅读(1477) 评论(0) 推荐(0) 编辑

2022年9月27日

摘要: 1. RTCGA包(了解) 数据库式的R包 优点:数据库式,将所有数据打包下载下来,可以在电脑上直接提取数据。 缺点:不是最新的数据。 library(RTCGA.rnaseq) #library(RTCGA.miRNASeq) library(RTCGA.clinical) ls("package 阅读全文
posted @ 2022-09-27 23:00 小高不高 阅读(607) 评论(0) 推荐(0) 编辑

摘要: 1. 整理表达矩阵 下载的文件是按样本存放的,每个tsv文件中都记录着一个样本的基因表达量,需要将所有tsv文件合并,得到所有样本的基因表达量的表格。 转录组数据合并 rm(list = ls()) library(stringr) library(jsonlite) library(progres 阅读全文
posted @ 2022-09-27 22:59 小高不高 阅读(5127) 评论(4) 推荐(0) 编辑

摘要: 表达矩阵一般比较大,小的几百M,大的1-2个G,浏览器直接下载很慢,后台一直打包下载不下来。需要用 命令行下载。 gdc-client工具下载网站: https://gdc.cancer.gov/access-data/gdc-data-transfer-tool 。此外,用 gdc-client. 阅读全文
posted @ 2022-09-27 22:58 小高不高 阅读(1275) 评论(0) 推荐(0) 编辑

摘要: 1. 设置镜像 options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/") options("repos" = c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/") 阅读全文
posted @ 2022-09-27 22:56 小高不高 阅读(242) 评论(0) 推荐(0) 编辑