摘要:https://www.jianshu.com/p/4519d2e64a49
阅读全文
摘要:https://www.jianshu.com/p/a3ac3568adde
阅读全文
摘要:1. DNA测序技术 https://www.jianshu.com/p/6122cecec54a 2.FASTA和FASTQ文件格式 https://www.jianshu.com/p/50ff302d049f 3.数据质控 https://www.jianshu.com/p/36891a89ed
阅读全文
摘要:下载地址:http://sangerbox.com/ https://shengxin.ren/article/208 Understanding TCGA mRNA Level3 analysis results files from FireBrowse http://zyxue.github.
阅读全文
摘要:order() 的返回值是对应“排名”元素所在向量中的位置。注意返回的不是元素本身,而是元素的位置。 sort() 是直接对向量中的元素进行排序,返回的是排序后的元素组成的向量。 rank() 是求秩的函数,返回值是这个向量中对应元素的排名。 > x<-c(1,5,8,2,9,7,4)> order
阅读全文
摘要:bioconduction 主页 http://www.bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html 安装 有时可能因为镜像或者网络的原因导致安装失败 我在 RStudio 使用 清华的镜像 在线文档
阅读全文
摘要:Error in readRDS(dest) : error reading from connection 解决办法:可能是镜像设置错误,导致无法抓取文件 修改 RStudio 中的镜像地址
阅读全文
摘要:这几个都是R语言中的特殊值,都是R的保留字, NA:Not available 表示缺失值 用 is.na() 来判断是否为缺失值 NULL:表示空值,即没有内容 用 is.null() 来判断是否为空值 NaN:Not a Number,表示非数值 用 is.nan() 来判断是否为非数值 Inf
阅读全文
摘要:1. 少用循环多用R自带的向量化运算,R的循环效率极低。 2. 使用驼峰命名法 或者 用点号分隔 avg.cliks 3. 函数命名第一个字母大写 4. 所有的二元运算符的两侧加空格,逗号后面添加空格 5. 使用 <- 进行赋值,不用 = 赋值 用 = 进行传值 6. 函数的定义应该首先列出无默认值
阅读全文
摘要:RPKM:Reads Per Kilobases Per Million Reads指的是每1百万个reads中比对到每1kb碱基外显子上的reads数 FPKM:Fragments Per Kilobase Per Million reads 当reads来自PE测序数据时使用FPKM TPM:
阅读全文
摘要:Empirical Analysis of Digital Gene Expression Data in R 安装 使用 library("edgeR") edgeRUserGuide() # 查看使用文档 查看在线的使用文档 http://www.bioconductor.org/package
阅读全文
摘要:安装 maps install.packages(“maps”) 使用 maps library("maps") nz <- map_data("nz")
阅读全文
摘要:tidyr包主要提供了数据整理和清洗的功能,包括 1. 数据框的变形 2. 处理数据框中的空值 3. 根据一个表格衍生出其他表格 4. 实现行或列的分隔和合并 该包将要用的数据处理成标准且统一的数据框(Tidy Data)才能进行下一步的数据处理和做图。 R将整洁数据定义为:每个变量的数据存储在自身
阅读全文
摘要:The d is for dataframes, the plyr is to evoke pliers. Pronounce however you like. dplyr包可用于处理 R 内部或者外部的结构化数据,相较于plyr包,dplyr包专注接受 data.frame 对象,大幅提高了速度
阅读全文
摘要:github主页 https://github.com/tidyverse/ggplot2 ggplot2中的函数:https://ggplot2.tidyverse.org/reference/index.html 图形范例:http://www.ggplot2-exts.org/gallery/
阅读全文
摘要:在linux上经常遇到这种问题,从网上下载文件到 linux 上后,就多了很多 ^M这种东西,如何集体删除这种东西呢! 用 vim 打开文件 进行如下设置 将文件格式转化为unix
阅读全文
摘要:输入数据 使用键盘输入数据 只能处理小样本,很少使用 在创建 data.txt 字符串之后,用函数 read.table() 创建数据框 data.1。这种方法可以让我们把数据嵌入到R代码中,此处切记,read.table() 使我们最为常用的读取外部数据的函数。 下面的方法是用函数 fix() 创
阅读全文
摘要:https://cran.r-project.org/web/packages/survival/index.html
阅读全文
摘要:http://www.webgestalt.org/ 通路富集分析 参考 http://www.sci666.com.cn/9596.html
阅读全文
摘要:http://gepia.cancer-pku.cn/
阅读全文
摘要:limma:Linear Models for Microarray and RNA-Seq Data http://www.bioconductor.org/packages/release/bioc/html/limma.html 安装 使用 library("limma") usersguid
阅读全文
摘要:https://portals.broadinstitute.org/ccle
阅读全文
摘要:http://www.funrich.org/
阅读全文
摘要:https://software.broadinstitute.org/morpheus/
阅读全文
摘要:http://xena.ucsc.edu/welcome-to-ucsc-xena/
阅读全文
摘要:LSF(Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。 bqueues:查看计算队列 bhosts:查看计算节点列表 lsload:查看负载 bsub:提交作业 bj
阅读全文
摘要:使用 R包 xlsx 或者 openxlsx 安装 install.packages("xlsx", repos="https://cloud.r-project.org/") install.packages("openxlsx", repos="https://cloud.r-project.o
阅读全文
摘要:网页 https://www.ebi.ac.uk/gxa/home 文档 https://www.ebi.ac.uk/gxa/help/index.html
阅读全文
摘要:网址 https://www.oncomine.org/resource/login.html Oncomine 是目前世界上最大的癌基因芯片数据库和整合数据挖掘平台,旨在挖掘癌症基因信息。Oncomine 拥有最全的癌症突变谱、基因表达数据以及相关的临床信息,可用于发现新的生物标记物或新的治疗靶点
阅读全文
摘要:from pathlib import Path 参考 https://www.jb51.net/article/148789.htm
阅读全文
摘要:DT 包提供了 JavaScript 库 DataTables 的一个R接口,它使得R对象(矩阵或数据框)可以在HTML页面上显示为表格。 该包的DataTables函数生成的表格提供了数据的筛选、分页、排序及其他功能,目前依法不再CRAN上。 安装方法 install.packages("DT",
阅读全文
摘要:获取当前路径 getwd() 切换当前路径 setwd() 返回上一级目录 setwd(dirname(getwd())) 获取文件所在路径 dirname() 查看当前目录的子目录 list.dirs() 查看当前目录的子目录和文件 dir() 查看指定目录的子目录及文件 dir(path="a/
阅读全文
摘要:TCGA 的数据可以在5个组织机构获取,它们都提供了类似的接口来供用户下载数据。 cgdsR 包是cBioPortal 提供的R包 http://www.cbioportal.org/rmatlab cgds -- Cancer genomic Data Service 安装 cgdsR 使用 cg
阅读全文
摘要:http://software.broadinstitute.org/gsea/index.jsp GSEA(Gene Set Enrichment Analysis)是一种生物信息学的计算方法,用于确定是否存在这样一个基因集,能在两个生物学状态中显示出显著的一致性的差异。表达谱数据里的基因数目众多
阅读全文
摘要:http://last.cbrc.jp/doc/lastal.html This program finds local alignments between query sequences, and reference sequences that have been prepared using
阅读全文
摘要:GEO Gene Expression Omnibus 基因表达数据库 网址:https://www.ncbi.nlm.nih.gov/geo/ GEO的数据存储方式 GEO数据库具体存放四类数据:GSE、GDS、GSM、GPL GEO Series Study GSE号(GSExxx)对应的是整个
阅读全文
摘要:http://www.cbioportal.org/ 参考连接 http://www.geneseed.com.cn/page464?article_id=413
阅读全文
摘要:http://www.genenames.org/ HGNC 全称为HUGO Gene Nomenclature Committee, 叫做 HUGO基因命名委员会,负责对人类基因组上包括蛋白编码基因, ncRNA基因,假基因和其他基因在内的所有基因提供一个唯一的,标准的,可以广泛传播的symbol
阅读全文