07 2019 档案

摘要:https://www.jianshu.com/p/4519d2e64a49 阅读全文

posted @ 2019-07-31 09:22 0820LL 阅读(785) 评论(0) 推荐(0)

摘要:https://www.jianshu.com/p/a3ac3568adde 阅读全文

posted @ 2019-07-31 09:09 0820LL 阅读(188) 评论(0) 推荐(0)

摘要:1. DNA测序技术 https://www.jianshu.com/p/6122cecec54a 2.FASTA和FASTQ文件格式 https://www.jianshu.com/p/50ff302d049f 3.数据质控 https://www.jianshu.com/p/36891a89ed 阅读全文

posted @ 2019-07-31 09:04 0820LL 阅读(1209) 评论(0) 推荐(0)

摘要:下载地址:http://sangerbox.com/ https://shengxin.ren/article/208 Understanding TCGA mRNA Level3 analysis results files from FireBrowse http://zyxue.github. 阅读全文

posted @ 2019-07-29 22:52 0820LL 阅读(3071) 评论(0) 推荐(0)

摘要:order() 的返回值是对应“排名”元素所在向量中的位置。注意返回的不是元素本身,而是元素的位置。 sort() 是直接对向量中的元素进行排序,返回的是排序后的元素组成的向量。 rank() 是求秩的函数,返回值是这个向量中对应元素的排名。 > x<-c(1,5,8,2,9,7,4)> order 阅读全文

posted @ 2019-07-28 19:03 0820LL 阅读(1549) 评论(0) 推荐(0)

摘要:bioconduction 主页 http://www.bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html 安装 有时可能因为镜像或者网络的原因导致安装失败 我在 RStudio 使用 清华的镜像 在线文档 阅读全文

posted @ 2019-07-27 17:15 0820LL 阅读(1058) 评论(0) 推荐(0)

摘要:Error in readRDS(dest) : error reading from connection 解决办法:可能是镜像设置错误,导致无法抓取文件 修改 RStudio 中的镜像地址 阅读全文

posted @ 2019-07-27 15:46 0820LL 阅读(24305) 评论(0) 推荐(1)

摘要:这几个都是R语言中的特殊值,都是R的保留字, NA:Not available 表示缺失值 用 is.na() 来判断是否为缺失值 NULL:表示空值,即没有内容 用 is.null() 来判断是否为空值 NaN:Not a Number,表示非数值 用 is.nan() 来判断是否为非数值 Inf 阅读全文

posted @ 2019-07-23 15:06 0820LL 阅读(1302) 评论(0) 推荐(0)

摘要:1. 少用循环多用R自带的向量化运算,R的循环效率极低。 2. 使用驼峰命名法 或者 用点号分隔 avg.cliks 3. 函数命名第一个字母大写 4. 所有的二元运算符的两侧加空格,逗号后面添加空格 5. 使用 <- 进行赋值,不用 = 赋值 用 = 进行传值 6. 函数的定义应该首先列出无默认值 阅读全文

posted @ 2019-07-23 08:43 0820LL 阅读(391) 评论(0) 推荐(0)

摘要:RPKM:Reads Per Kilobases Per Million Reads指的是每1百万个reads中比对到每1kb碱基外显子上的reads数 FPKM:Fragments Per Kilobase Per Million reads 当reads来自PE测序数据时使用FPKM TPM: 阅读全文

posted @ 2019-07-21 23:42 0820LL 阅读(718) 评论(0) 推荐(0)

摘要:Empirical Analysis of Digital Gene Expression Data in R 安装 使用 library("edgeR") edgeRUserGuide() # 查看使用文档 查看在线的使用文档 http://www.bioconductor.org/package 阅读全文

posted @ 2019-07-16 22:43 0820LL 阅读(196) 评论(0) 推荐(0)

摘要:安装 maps install.packages(“maps”) 使用 maps library("maps") nz <- map_data("nz") 阅读全文

posted @ 2019-07-15 15:44 0820LL 阅读(283) 评论(0) 推荐(0)

摘要:tidyr包主要提供了数据整理和清洗的功能,包括 1. 数据框的变形 2. 处理数据框中的空值 3. 根据一个表格衍生出其他表格 4. 实现行或列的分隔和合并 该包将要用的数据处理成标准且统一的数据框(Tidy Data)才能进行下一步的数据处理和做图。 R将整洁数据定义为:每个变量的数据存储在自身 阅读全文

posted @ 2019-07-15 14:36 0820LL 阅读(173) 评论(0) 推荐(0)

摘要:The d is for dataframes, the plyr is to evoke pliers. Pronounce however you like. dplyr包可用于处理 R 内部或者外部的结构化数据,相较于plyr包,dplyr包专注接受 data.frame 对象,大幅提高了速度 阅读全文

posted @ 2019-07-15 14:32 0820LL 阅读(453) 评论(0) 推荐(0)

摘要:github主页 https://github.com/tidyverse/ggplot2 ggplot2中的函数:https://ggplot2.tidyverse.org/reference/index.html 图形范例:http://www.ggplot2-exts.org/gallery/ 阅读全文

posted @ 2019-07-12 17:00 0820LL 阅读(341) 评论(0) 推荐(0)

摘要:在linux上经常遇到这种问题,从网上下载文件到 linux 上后,就多了很多 ^M这种东西,如何集体删除这种东西呢! 用 vim 打开文件 进行如下设置 将文件格式转化为unix 阅读全文

posted @ 2019-07-12 11:10 0820LL 阅读(219) 评论(0) 推荐(0)

摘要:输入数据 使用键盘输入数据 只能处理小样本,很少使用 在创建 data.txt 字符串之后,用函数 read.table() 创建数据框 data.1。这种方法可以让我们把数据嵌入到R代码中,此处切记,read.table() 使我们最为常用的读取外部数据的函数。 下面的方法是用函数 fix() 创 阅读全文

posted @ 2019-07-11 14:34 0820LL 阅读(1859) 评论(0) 推荐(0)

摘要:https://cran.r-project.org/web/packages/survival/index.html 阅读全文

posted @ 2019-07-10 16:54 0820LL 阅读(540) 评论(0) 推荐(0)

摘要:http://www.webgestalt.org/ 通路富集分析 参考 http://www.sci666.com.cn/9596.html 阅读全文

posted @ 2019-07-10 16:47 0820LL 阅读(930) 评论(0) 推荐(0)

摘要:http://gepia.cancer-pku.cn/ 阅读全文

posted @ 2019-07-10 14:38 0820LL 阅读(866) 评论(0) 推荐(0)

摘要:limma:Linear Models for Microarray and RNA-Seq Data http://www.bioconductor.org/packages/release/bioc/html/limma.html 安装 使用 library("limma") usersguid 阅读全文

posted @ 2019-07-10 14:34 0820LL 阅读(430) 评论(0) 推荐(0)

摘要:https://portals.broadinstitute.org/ccle 阅读全文

posted @ 2019-07-10 14:18 0820LL 阅读(877) 评论(0) 推荐(0)

摘要:http://www.funrich.org/ 阅读全文

posted @ 2019-07-10 14:10 0820LL 阅读(864) 评论(0) 推荐(0)

摘要:https://software.broadinstitute.org/morpheus/ 阅读全文

posted @ 2019-07-10 14:09 0820LL 阅读(203) 评论(0) 推荐(0)

摘要:http://xena.ucsc.edu/welcome-to-ucsc-xena/ 阅读全文

posted @ 2019-07-09 22:58 0820LL 阅读(141) 评论(0) 推荐(0)

摘要:LSF(Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。 bqueues:查看计算队列 bhosts:查看计算节点列表 lsload:查看负载 bsub:提交作业 bj 阅读全文

posted @ 2019-07-09 16:44 0820LL 阅读(2038) 评论(0) 推荐(0)

摘要:使用 R包 xlsx 或者 openxlsx 安装 install.packages("xlsx", repos="https://cloud.r-project.org/") install.packages("openxlsx", repos="https://cloud.r-project.o 阅读全文

posted @ 2019-07-09 10:33 0820LL 阅读(1366) 评论(0) 推荐(0)

摘要:网页 https://www.ebi.ac.uk/gxa/home 文档 https://www.ebi.ac.uk/gxa/help/index.html 阅读全文

posted @ 2019-07-08 23:29 0820LL 阅读(257) 评论(0) 推荐(0)

摘要:网址 https://www.oncomine.org/resource/login.html Oncomine 是目前世界上最大的癌基因芯片数据库和整合数据挖掘平台,旨在挖掘癌症基因信息。Oncomine 拥有最全的癌症突变谱、基因表达数据以及相关的临床信息,可用于发现新的生物标记物或新的治疗靶点 阅读全文

posted @ 2019-07-08 22:47 0820LL 阅读(1328) 评论(0) 推荐(0)

摘要:from pathlib import Path 参考 https://www.jb51.net/article/148789.htm 阅读全文

posted @ 2019-07-08 17:31 0820LL 阅读(302) 评论(0) 推荐(0)

摘要:DT 包提供了 JavaScript 库 DataTables 的一个R接口,它使得R对象(矩阵或数据框)可以在HTML页面上显示为表格。 该包的DataTables函数生成的表格提供了数据的筛选、分页、排序及其他功能,目前依法不再CRAN上。 安装方法 install.packages("DT", 阅读全文

posted @ 2019-07-07 20:35 0820LL 阅读(880) 评论(0) 推荐(0)

摘要:获取当前路径 getwd() 切换当前路径 setwd() 返回上一级目录 setwd(dirname(getwd())) 获取文件所在路径 dirname() 查看当前目录的子目录 list.dirs() 查看当前目录的子目录和文件 dir() 查看指定目录的子目录及文件 dir(path="a/ 阅读全文

posted @ 2019-07-06 17:26 0820LL 阅读(1236) 评论(0) 推荐(0)

摘要:TCGA 的数据可以在5个组织机构获取,它们都提供了类似的接口来供用户下载数据。 cgdsR 包是cBioPortal 提供的R包 http://www.cbioportal.org/rmatlab cgds -- Cancer genomic Data Service 安装 cgdsR 使用 cg 阅读全文

posted @ 2019-07-05 17:20 0820LL 阅读(610) 评论(0) 推荐(0)

摘要:http://software.broadinstitute.org/gsea/index.jsp GSEA(Gene Set Enrichment Analysis)是一种生物信息学的计算方法,用于确定是否存在这样一个基因集,能在两个生物学状态中显示出显著的一致性的差异。表达谱数据里的基因数目众多 阅读全文

posted @ 2019-07-05 15:49 0820LL 阅读(2530) 评论(0) 推荐(0)

摘要:http://last.cbrc.jp/doc/lastal.html This program finds local alignments between query sequences, and reference sequences that have been prepared using 阅读全文

posted @ 2019-07-05 10:25 0820LL 阅读(492) 评论(0) 推荐(0)

摘要:GEO Gene Expression Omnibus 基因表达数据库 网址:https://www.ncbi.nlm.nih.gov/geo/ GEO的数据存储方式 GEO数据库具体存放四类数据:GSE、GDS、GSM、GPL GEO Series Study GSE号(GSExxx)对应的是整个 阅读全文

posted @ 2019-07-01 18:00 0820LL 阅读(1155) 评论(0) 推荐(0)

摘要:http://www.cbioportal.org/ 参考连接 http://www.geneseed.com.cn/page464?article_id=413 阅读全文

posted @ 2019-07-01 17:51 0820LL 阅读(361) 评论(0) 推荐(0)

摘要:http://www.genenames.org/ HGNC 全称为HUGO Gene Nomenclature Committee, 叫做 HUGO基因命名委员会,负责对人类基因组上包括蛋白编码基因, ncRNA基因,假基因和其他基因在内的所有基因提供一个唯一的,标准的,可以广泛传播的symbol 阅读全文

posted @ 2019-07-01 17:07 0820LL 阅读(880) 评论(0) 推荐(0)

导航