07 2019 档案

WES数据分析流程
摘要:https://www.jianshu.com/p/4519d2e64a49 阅读全文

posted @ 2019-07-31 09:22 0820LL 阅读(767) 评论(0) 推荐(0) 编辑

如何快速估算测序量
摘要:https://www.jianshu.com/p/a3ac3568adde 阅读全文

posted @ 2019-07-31 09:09 0820LL 阅读(178) 评论(0) 推荐(0) 编辑

WGS 全基因组测序数据分析
摘要:1. DNA测序技术 https://www.jianshu.com/p/6122cecec54a 2.FASTA和FASTQ文件格式 https://www.jianshu.com/p/50ff302d049f 3.数据质控 https://www.jianshu.com/p/36891a89ed 阅读全文

posted @ 2019-07-31 09:04 0820LL 阅读(1183) 评论(0) 推荐(0) 编辑

TCGA简易下载工具 SangerBox
摘要:下载地址:http://sangerbox.com/ https://shengxin.ren/article/208 Understanding TCGA mRNA Level3 analysis results files from FireBrowse http://zyxue.github. 阅读全文

posted @ 2019-07-29 22:52 0820LL 阅读(3007) 评论(0) 推荐(0) 编辑

R语言排序 -- sort() order() rank()
摘要:order() 的返回值是对应“排名”元素所在向量中的位置。注意返回的不是元素本身,而是元素的位置。 sort() 是直接对向量中的元素进行排序,返回的是排序后的元素组成的向量。 rank() 是求秩的函数,返回值是这个向量中对应元素的排名。 > x<-c(1,5,8,2,9,7,4)> order 阅读全文

posted @ 2019-07-28 19:03 0820LL 阅读(1532) 评论(0) 推荐(0) 编辑

org.Hs.eg.db
摘要:bioconduction 主页 http://www.bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html 安装 有时可能因为镜像或者网络的原因导致安装失败 我在 RStudio 使用 清华的镜像 在线文档 阅读全文

posted @ 2019-07-27 17:15 0820LL 阅读(906) 评论(0) 推荐(0) 编辑

Error in readRDS(dest) : error reading from connection
摘要:Error in readRDS(dest) : error reading from connection 解决办法:可能是镜像设置错误,导致无法抓取文件 修改 RStudio 中的镜像地址 阅读全文

posted @ 2019-07-27 15:46 0820LL 阅读(23276) 评论(0) 推荐(1) 编辑

R语言中的特殊值 NA NULL NaN Inf
摘要:这几个都是R语言中的特殊值,都是R的保留字, NA:Not available 表示缺失值 用 is.na() 来判断是否为缺失值 NULL:表示空值,即没有内容 用 is.null() 来判断是否为空值 NaN:Not a Number,表示非数值 用 is.nan() 来判断是否为非数值 Inf 阅读全文

posted @ 2019-07-23 15:06 0820LL 阅读(1248) 评论(0) 推荐(0) 编辑

R程序书写规范
摘要:1. 少用循环多用R自带的向量化运算,R的循环效率极低。 2. 使用驼峰命名法 或者 用点号分隔 avg.cliks 3. 函数命名第一个字母大写 4. 所有的二元运算符的两侧加空格,逗号后面添加空格 5. 使用 <- 进行赋值,不用 = 赋值 用 = 进行传值 6. 函数的定义应该首先列出无默认值 阅读全文

posted @ 2019-07-23 08:43 0820LL 阅读(365) 评论(0) 推荐(0) 编辑

RPKM FPKM TPM RSEM
摘要:RPKM:Reads Per Kilobases Per Million Reads指的是每1百万个reads中比对到每1kb碱基外显子上的reads数 FPKM:Fragments Per Kilobase Per Million reads 当reads来自PE测序数据时使用FPKM TPM: 阅读全文

posted @ 2019-07-21 23:42 0820LL 阅读(700) 评论(0) 推荐(0) 编辑

edgeR
摘要:Empirical Analysis of Digital Gene Expression Data in R 安装 使用 library("edgeR") edgeRUserGuide() # 查看使用文档 查看在线的使用文档 http://www.bioconductor.org/package 阅读全文

posted @ 2019-07-16 22:43 0820LL 阅读(176) 评论(0) 推荐(0) 编辑

R地图包 maps
摘要:安装 maps install.packages(“maps”) 使用 maps library("maps") nz <- map_data("nz") 阅读全文

posted @ 2019-07-15 15:44 0820LL 阅读(269) 评论(0) 推荐(0) 编辑

tidyr
摘要:tidyr包主要提供了数据整理和清洗的功能,包括 1. 数据框的变形 2. 处理数据框中的空值 3. 根据一个表格衍生出其他表格 4. 实现行或列的分隔和合并 该包将要用的数据处理成标准且统一的数据框(Tidy Data)才能进行下一步的数据处理和做图。 R将整洁数据定义为:每个变量的数据存储在自身 阅读全文

posted @ 2019-07-15 14:36 0820LL 阅读(152) 评论(0) 推荐(0) 编辑

dplyr
摘要:The d is for dataframes, the plyr is to evoke pliers. Pronounce however you like. dplyr包可用于处理 R 内部或者外部的结构化数据,相较于plyr包,dplyr包专注接受 data.frame 对象,大幅提高了速度 阅读全文

posted @ 2019-07-15 14:32 0820LL 阅读(434) 评论(0) 推荐(0) 编辑

ggplot2
摘要:github主页 https://github.com/tidyverse/ggplot2 ggplot2中的函数:https://ggplot2.tidyverse.org/reference/index.html 图形范例:http://www.ggplot2-exts.org/gallery/ 阅读全文

posted @ 2019-07-12 17:00 0820LL 阅读(312) 评论(0) 推荐(0) 编辑

linux 去掉 ^M 的方法
摘要:在linux上经常遇到这种问题,从网上下载文件到 linux 上后,就多了很多 ^M这种东西,如何集体删除这种东西呢! 用 vim 打开文件 进行如下设置 将文件格式转化为unix 阅读全文

posted @ 2019-07-12 11:10 0820LL 阅读(205) 评论(0) 推荐(0) 编辑

R 语言输入输出 读取命令函参数
摘要:输入数据 使用键盘输入数据 只能处理小样本,很少使用 在创建 data.txt 字符串之后,用函数 read.table() 创建数据框 data.1。这种方法可以让我们把数据嵌入到R代码中,此处切记,read.table() 使我们最为常用的读取外部数据的函数。 下面的方法是用函数 fix() 创 阅读全文

posted @ 2019-07-11 14:34 0820LL 阅读(1804) 评论(0) 推荐(0) 编辑

R包 survival 生存分析
摘要:https://cran.r-project.org/web/packages/survival/index.html 阅读全文

posted @ 2019-07-10 16:54 0820LL 阅读(511) 评论(0) 推荐(0) 编辑

webgestalt 通路富集分析
摘要:http://www.webgestalt.org/ 通路富集分析 参考 http://www.sci666.com.cn/9596.html 阅读全文

posted @ 2019-07-10 16:47 0820LL 阅读(892) 评论(0) 推荐(0) 编辑

GEPIA GEPIA2 数据库
摘要:http://gepia.cancer-pku.cn/ 阅读全文

posted @ 2019-07-10 14:38 0820LL 阅读(798) 评论(0) 推荐(0) 编辑

limma 包
摘要:limma:Linear Models for Microarray and RNA-Seq Data http://www.bioconductor.org/packages/release/bioc/html/limma.html 安装 使用 library("limma") usersguid 阅读全文

posted @ 2019-07-10 14:34 0820LL 阅读(405) 评论(0) 推荐(0) 编辑

Cancer Cell Line Encyclopedia
摘要:https://portals.broadinstitute.org/ccle 阅读全文

posted @ 2019-07-10 14:18 0820LL 阅读(782) 评论(0) 推荐(0) 编辑

Funrich 基因功能富集分析
摘要:http://www.funrich.org/ 阅读全文

posted @ 2019-07-10 14:10 0820LL 阅读(819) 评论(0) 推荐(0) 编辑

Morpheus
摘要:https://software.broadinstitute.org/morpheus/ 阅读全文

posted @ 2019-07-10 14:09 0820LL 阅读(195) 评论(0) 推荐(0) 编辑

UCSC cancer genome
摘要:http://xena.ucsc.edu/welcome-to-ucsc-xena/ 阅读全文

posted @ 2019-07-09 22:58 0820LL 阅读(124) 评论(0) 推荐(0) 编辑

LSF 作业系统常用命令
摘要:LSF(Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。 bqueues:查看计算队列 bhosts:查看计算节点列表 lsload:查看负载 bsub:提交作业 bj 阅读全文

posted @ 2019-07-09 16:44 0820LL 阅读(1883) 评论(0) 推荐(0) 编辑

R 语言处理excel为data.frame
摘要:使用 R包 xlsx 或者 openxlsx 安装 install.packages("xlsx", repos="https://cloud.r-project.org/") install.packages("openxlsx", repos="https://cloud.r-project.o 阅读全文

posted @ 2019-07-09 10:33 0820LL 阅读(1271) 评论(0) 推荐(0) 编辑

Expression Atlas
摘要:网页 https://www.ebi.ac.uk/gxa/home 文档 https://www.ebi.ac.uk/gxa/help/index.html 阅读全文

posted @ 2019-07-08 23:29 0820LL 阅读(204) 评论(0) 推荐(0) 编辑

Oncomine 数据库
摘要:网址 https://www.oncomine.org/resource/login.html Oncomine 是目前世界上最大的癌基因芯片数据库和整合数据挖掘平台,旨在挖掘癌症基因信息。Oncomine 拥有最全的癌症突变谱、基因表达数据以及相关的临床信息,可用于发现新的生物标记物或新的治疗靶点 阅读全文

posted @ 2019-07-08 22:47 0820LL 阅读(1232) 评论(0) 推荐(0) 编辑

pathlib.Path 类的使用
摘要:from pathlib import Path 参考 https://www.jb51.net/article/148789.htm 阅读全文

posted @ 2019-07-08 17:31 0820LL 阅读(288) 评论(0) 推荐(0) 编辑

DT包 -- R语言中自定义表格数据
摘要:DT 包提供了 JavaScript 库 DataTables 的一个R接口,它使得R对象(矩阵或数据框)可以在HTML页面上显示为表格。 该包的DataTables函数生成的表格提供了数据的筛选、分页、排序及其他功能,目前依法不再CRAN上。 安装方法 install.packages("DT", 阅读全文

posted @ 2019-07-07 20:35 0820LL 阅读(832) 评论(0) 推荐(0) 编辑

R 目录及文件操作
摘要:获取当前路径 getwd() 切换当前路径 setwd() 返回上一级目录 setwd(dirname(getwd())) 获取文件所在路径 dirname() 查看当前目录的子目录 list.dirs() 查看当前目录的子目录和文件 dir() 查看指定目录的子目录及文件 dir(path="a/ 阅读全文

posted @ 2019-07-06 17:26 0820LL 阅读(1152) 评论(0) 推荐(0) 编辑

cgdsR 下载TCGA数据
摘要:TCGA 的数据可以在5个组织机构获取,它们都提供了类似的接口来供用户下载数据。 cgdsR 包是cBioPortal 提供的R包 http://www.cbioportal.org/rmatlab cgds -- Cancer genomic Data Service 安装 cgdsR 使用 cg 阅读全文

posted @ 2019-07-05 17:20 0820LL 阅读(580) 评论(0) 推荐(0) 编辑

GSEA 基因集富集分析
摘要:http://software.broadinstitute.org/gsea/index.jsp GSEA(Gene Set Enrichment Analysis)是一种生物信息学的计算方法,用于确定是否存在这样一个基因集,能在两个生物学状态中显示出显著的一致性的差异。表达谱数据里的基因数目众多 阅读全文

posted @ 2019-07-05 15:49 0820LL 阅读(2261) 评论(0) 推荐(0) 编辑

lastal
摘要:http://last.cbrc.jp/doc/lastal.html This program finds local alignments between query sequences, and reference sequences that have been prepared using 阅读全文

posted @ 2019-07-05 10:25 0820LL 阅读(468) 评论(0) 推荐(0) 编辑

GEO Gene Expression Omnibus
摘要:GEO Gene Expression Omnibus 基因表达数据库 网址:https://www.ncbi.nlm.nih.gov/geo/ GEO的数据存储方式 GEO数据库具体存放四类数据:GSE、GDS、GSM、GPL GEO Series Study GSE号(GSExxx)对应的是整个 阅读全文

posted @ 2019-07-01 18:00 0820LL 阅读(863) 评论(0) 推荐(0) 编辑

cBioPortal 数据库
摘要:http://www.cbioportal.org/ 参考连接 http://www.geneseed.com.cn/page464?article_id=413 阅读全文

posted @ 2019-07-01 17:51 0820LL 阅读(340) 评论(0) 推荐(0) 编辑

HGNC数据库 HUGO基因命名委员会
摘要:http://www.genenames.org/ HGNC 全称为HUGO Gene Nomenclature Committee, 叫做 HUGO基因命名委员会,负责对人类基因组上包括蛋白编码基因, ncRNA基因,假基因和其他基因在内的所有基因提供一个唯一的,标准的,可以广泛传播的symbol 阅读全文

posted @ 2019-07-01 17:07 0820LL 阅读(747) 评论(0) 推荐(0) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示